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3. البرامج المرتبطة بالمترجمات 
Programs to Compilers Related‏ 

سيتم في هذا الجزء إعطاء وصف مختصر لمجموعة البرامج ج المرتبطة بالمترجمات أو التي تستخدم 

معها والتي غالبا ما تأتي معها ضمن البيئة الكاملة الخاصة بإعداد البرامج بلغة البرمجة حيث تشمل هذه 

المجموعة البرامج الأتية: 
3.. المترجمات الفوریة Inter pre‏ 

هى ايضا مترجمات للغات البرمجة مثل باقى المترجمات ولكنها تختلف في كونها تقوم بتنفيذ برنامج 
المصدر ( ۳ه عه٣۴‏ عucمك‏ ) مباشرة دون توليد شفرة الهدف التي يتم تنفيذها بعد الانتهاء من 
الترجمة بالكامل كما يحدث في حالة استخدام المترجمات المعتادة ( ك١ءاامص۳ه)‏ ) ويفضل استخدام 
المترجمات الفورية مع بعض لغات البرمجة مثل لغة ال 8۸51٥‏ وخاصة في الأغراض التعليمية وذلك 
لكونها تقوم بتوضيح الاخطاء الموجودة في البرنامج خطوة خطوة وأولا بأول ولكن يعاب على هذا 
النوع من المترجمات أنها تقوم بإعادة الترجمة في كل مرة يتم فيها تنفيذ البرنامج لذلك فإن المترجمات 
المعتادة يفضل استخدامها إذا كانت السرعة مطلوبة في تنفيذ البرنامج وذلك لأن تنفيذ النسخة المترجمة 
من البرنامج يكون أسرع من تنفيذ البرنامج المصدر بدرجة تصل إلى عشرة أضعاف وعموما فإن كلا 
من المترجمات الفورية والمترجمات المعتادة يتشابهان ويشتركان في عدد كبير من العمليات ولكننا 
سنركز في شرحها في تلك المادة العلمية على المترجمات المعتادة فقط. 
2.3 lاlئnجaaہlٽت Assemblers‏ 

المجمّع هو مترجم للغة تجميع خاصة بحاسب محدد وكما ذكرنا سابقا فإن لغة التجميع هو شكل 
رمزى للغة الآلة الخاصة بتلك الحاسب ولذلك فإنها أسهل في الترجمة وفي بعض الاحيان تقوم 
المترجمات المعتادة الخاصة بلغات البرمجة بتوليد لغة التجميع المقابلة لتلك اللغات تم يقوم المجمع 
بتحويلها إلى لغة الآلة. 
3 برامج الربط ke۲۶ہLi‏ 

تحتاج كل من المترجمات والمجمعات في الغالب إلى برنامج يسمى الرابط الذي يقوم بدمج شفرات 
الملفات الناتجة عن عملية الترجمة أو التجميع في ملف مستهدف واحد قابل للتنفيذ مباشرة وايضا يقوم 
الرابط باضافة شفرة الوظائف الجاهزة ( Functions‏ in-tاBui‏ ) المستخدمة وبعض الخدمات 
المطلوبة من نظام التشغيل الخاص بالحاسب إلى ذلك الملف التنفيذى المستهدف وعموما فإن الدور الذي 
يقوم به الرابط كان في السابق ضمن وظائف المترجمات ولكن تم فصله بعد ذلك ولهذا فلن يتم شرحه 
في هذه المادة العلمية. 
3 برامج التحميل ۲5٥ل‏ 2ا 

غالبا ما تقوم المترجمات والمجمعات بتوليد شفرة البرنامج المستهدف دون أن تحتوى على تحديد 
للمواقع التخزينية التي في الذاكرة بشكل مطلق بل أنها تتوقف على موقع البرنامج نفسه في الذاكرة ويتم 
ذلك لاعطاء الفرصة لتحميل البرنامج في أي موقع بالذاكرة بالاضافة إلى عدم الاحتياج إلى إعادة 
الترجمة عند نقله من موقع لآخر حيث يقوم برنامج التحميل بتحويل تلك المواقع التخزينية القابلة للنقل 
إلى مواقع تخزينية ثابتة عند قيامه بتحميل البرنامج إلى الذاكرة. 
3 برامج التحریر ٤ di0٣١۶‏ 

إن المترجمات دائما ما تقبل برامج المصدر ( ۶٣ھ‏ عہا۴ ٥٤ں‏ ) المكتوبة باستخدام أحد برامج 
التحرير لهذا فإن عملية الترجمة غالبا ما تتم من داخل تلك البرامج لكى تكوّن بيئة تفاعلية متكاملة 
لتحرير البرامج وفي هذه الحالة يكون برنامج التحرير مرتبط بلغة محددة من لغات البرمجة وهى اللغة 
التي يتضمن البرنامج المترجم الخاص بها وعند ذلك يكون برنامج التحرير موجه لتلك اللغة ومهيكل 
وفقا للصيغ النحوية الخاصة بها مما يسهل من عملية تحرير البرامج بهذه اللغة. 


جامعة النيلين - كلية العلوم/ مدرسة العلوم الرياضية- إعداد / عمر إبراهيم عبدالله Compiler for msc of cs‏ 


4. مراحJ‏ llمترجp Compiler Stages‏ 
يتكون المترجم من مجموعة من الخطوات أو المراحل التي تقوم بانجاز عدد من العمليات المختلفة 
ومن الأفضل أن نفكر في تلك المراحل على أنها أجزاءَ منفصلة داخل المترجم على الرغم من كونها من 
الناخية الغلة نكرتوا رحدة ولخذة و الكل التالن تر طح مراكل المتز حم النخفة بالاضافة إلى تة 

مكونات اضافية تتفاعل مع جزء أو كل هذه المراحل: 

وسنقوم بوصف تلك المراحل باختصار في هذا الجزء على أن يتم دراسة المراحل الثلاثة الأولى 
تفيل فى اليضات الزاعة والخامة والساتسة غلى القرالى وة لمراخل المتر ج الأغزئ فلن 
يتم شرحها في هذه المادة العلمية. أما المكونات الثلاثة الإضافية فسيتم عرضها في الجزء الأخير من 
هذه الوحدة. 

1.4 محلل المفردات Lexical Analyzer‏ 
إن محلل المفردات أو مايطلق علية أحيانا الماسح ( ۲ع" "هةء؟ ) هو الذي يقوم بالقراءة الفعلية لبرنامج 
المصدر على هيئة سلسلة متتابعة من الحروف حيث يقوم بتجميع سلاسل الحروف التي تكون وحدات 
ذات معنى تكون مفردات ( ء١ع‌)ها‏ ) لغة البرمجة وبالتالي فإن دور محلل المفردات هو تمييز 

مفردات اللغة فعلى سبيل المثال بفرض سطر الشفرة التالي المكتوب بلغة السى: 


a [index] = 4 + 2 

هذا السطر يتكون من 12 حرفا وبحذف المسافات تكون 8 مفردات كالاتى: 
identifier‏ ۾ معرف 

bracket ]‏ eftا‏ (قوس ايسر (فتحة قوس 

index identifier‏ معرف 


ight bracket [‏ ( قوس ایمن (اغلاق قوس 


assignment sign‏ رمز التخصیص 

number 4‏ عدد 

sin +‏ usام‏ رمز الجمع 

number 2‏ عدد 

وكل مفردة من المفردات السابقة تتکون من حرف واحد أو أكثر يتم تجميعها في وحدة واحدة قبل القيام 
بالمراحل التالية ومحلل المفردات قد يقوم بعمليات أخرى بالإضافة إلى تمييز المفردات مثل إضافة 
المعرفات إلى جدول الرموز وإضافة الثوابت إلى جدول الثوابت. 


4.. محلل الصيغ انحوي Syntax Analyzer‏ 
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المصدر في شكل مفردات من محلل المفردات ليقوم بتحليل الصيغ النحوية لتحديد هيكل البرنامج وذلك 
مثل تحليل القواعد لجملة من جمل اللغات الطبيعية ونتيجة لهذه المرحلة يتم إنشاء شجرة الإعراب ( 
Parse ree‏ ) أو شجرة النحو ( ۲۲٠٠١‏ ×ه†مرك ) وكمتال على ذلك بفرض سطر الشفرة السابق 
المكتوب بلغة السى فإنه عبارة عن تعبير ( ۸٥اءوع۲م×ع‏ ) يمثل الهيكل الخاص باأمر التخصيص في 
تلك اللغة وهذا الهيكل يمكن تمثيلة باستخدام شجرة الإعراب التالية: 


الشكل (2) 


حيث يلاحظ أن العقد الداخلية من شجرة الإعراب معنونة بأسماء التراكيب التي يمثلها بينما أوراق 
شجرة الإعراب تمثل تتابع المفردات من المدخلات. 


وأحيانا يتم انشاء شجرة النحو بدلا من شجرة الإعراب حيث تختصر شجرة النحو بعض المعلومات 
المعروضة في شجرة الإعراب لانها أكثر منها تجريداً. فشجرة النحو الخاصة بمثال أمر التخصيص 
السابق تكون كما يلى: 


ويلاحظ أن عدد من العقد لم تظهر في شجرة النحو بما فيها بعض المفردات. 
4.. محللJ‏ لد ںٺٺٰږںڼٽ Semantic Analyzer‏ 


إن دلالات البرنامج هى المعنى الخاص في مقابلة صيغه النحوية ويتم تحديد دلالات أي برنامج من 
خلال سلوكه أثناء التشغيل ولكن معظم لغات البرمجة لديها بعض الصفات التي يمكن تحديدها قبل البدء 
في التشغيل ولكن تلك الصفات لا يستطيع وصفها أو تحليلها بواسطة محلل الصيغ النحوية ويطلق على 
هذه الصفات لقب الدلالات الثابتة ( وعأأة" ه5 ءخه†5) ومهمة محلل الدلالات هو تحليل هذا النوع 
من الدلالات التي تشمل بشكل أساسي التعريفات ( ك ها†ةهاءم0) واختبار الأنواع( عمراآ 
عcheckin)‏ والمعلومات الإضافیة التي تعکس ھذہ الدلالات تسمی خصائص ( عا u‏ طا٣٤A)‏ ویتم 
تحديدها أثناء المرحلة الحالية وغالبا ما تتم إضافتها كحواشي لشجرة الإعراب أو شجرة النحو وقد 
تضاف أيضا لجدول الرموز. ففى مثال أمر التخصيص السابق نجد أن المعلومات الاساسية الخاصة 
بالنوع والتي يجب تجميعها قبل البدء في تحليل الدلالات الخاصة بهذا الأمر هي ان المتغير ۾ عبارة 
عن مصفوفة للقيم الصحيحة (ء٣٠عع”|)‏ وأن مدى الفهرس الخاص بتلك المصفوفة يجب أن يكون من 
القيم الصحيحة ايضا وبالفعل المتغير ×عل"| هو متغير صحيح تم يقوم محلل الدلالات باضافة تلك 
الخصائص كحواشي لشجرة النحو لتصبح كما يلي: 


وبعد الانتهاء من ذلك يتم التأكد من أن أمر التخصيص يمكن أن يتم بالنسبة لهذا النوع من البيانات فإذا 
كان ذلك صحيح كما في المثال فإن محلل الدلالات يعلن توافق أنواع البيانات في الأمر وإلا فانه يعطى 
رسالة خطأ تفيد عدم وجود هذا التوافق. 


Source Code Optimizer محسن شفرة المصر‎ ..4 
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إن المترجمات عادة ما تشتمل على عدد من الخطوات الخاصة بتحسين شفرة البرنامج وفي أغلب 
الأحوال تكون الخطوة الأولى منها بعد الانتهاء من تحليل الدلالات حيث يكون هناك إمكانية لمتل هذا 
التحسين ولكنه مرتبط فقط بشفرة المصدر الذى يظهر كمرحلة منفصلة من مراحل الترجمة و عموماً 
فإن المترجمات المتعددة تختلف فيما بينها ليس فقط في نوع التحسين الذي يتم ولكن أيضا في موقع ذلك 
التحسين ضمن مراحل الترجمة. 


ففي مثالنا السابق هناك فرصة لهذا التحسين على مستوى برنامج المصدر يتمثل في التعبير 2+ 4 
حيث يمكن حسابه في هذه المرحلة واستبداله بالناتج 6 وهذا التحسين يمكن أن يتم مباشرة في شجرة 
النحو ذات الحواشي عن طريق دمج الجانب الأيمن من الشجرة ليعبر فقط عن قيمة ثابتة كما يلي : 


ويوجد تحسينات متعددة يمكن إجراءها مباشرة على الشجرة ولكن في أغلب الحالات يكون ذلك أسهل 
تنفيذه على الشكل الخطي للشجرة الذي يكون قريب من شفرة لغة التجميع وهي ما تسمى بالشفرة 
الوسيطة ( C٥٥‏ عtةiلعمص١عtما)‏ وذلك في إشارة إلى كون هذه الشفرة تقع بين شفرة المصدر وشفرة 
الهدف والتي تعتبر تمثيل داخلي لبرنامج المصدر يستخدم فقط بواسطة المترجم وعلى هذا فان شجرة 
النحو يمكن أيضا اعتبارها شفرة وسيطة ولذلك فإن الشفرة الوسيطة يشار إليها في بعض الأحيان بكونها 
تمثيل و سيط ( Representa ti0‏ termediateہا)‏ ولیس مجرد شفرة. 


Code Generator ةرفشضll مود‎ 5.4 


مولد الشفرة يأخذ كمدخلات الشفرة أو التمثيل الوسيط ليقوم بتوليد شفرة خاصة بالآلة المستهدفة 
والتي هي شفرة الهدف وفي هذه المرحلة من الترجمة فإن خصائص الالة (الحاسب) المستهدفة يكون 
لها التأثير الأساسي وهذا ليس فقط من حيث ضرورة استخدام الأوامر الموجودة في الألة المستهدفة 
ولكن أيضا عند اتخاذ القرارات الخاصة بتمثيل البيانات والتي يتم فيها تحديد المساحة التي يشغلها كل 
بيان في الذاكرة . 


Object Code Optimizer محسّن شفرة الد‎ .6.4 


في هذه المرحلة يحاول المترجم إأجراء التحسينات في شفرة الهدف التي تم توليدها في المرحلة 
السابقة وهذه التحسينات تشمل اختيار أسلوب العنونة (Addressing Mode)‏ المناسب الذي يزيد من 
سر عة تنفيد البرنامج واستبدال الأوامر البطيئة بأوامر أسرع وكذلك حذف العمليات المتكررة غير 
الضرورية. 


وبنهاية هذه المرحلة ينتهي الوصف المختصر لمراحل المترجم مع ضرورة التأكيد أن هذا الوصف 
يوضح فقط وظيفة كل مرحلة وليس من الضروري أن يعكس التنظيم الفعلي للمترجمات والتي تختلف 
كثيرآ عن بعضها البعض في تفاصيلها التنظيمية ولكن مع ذلك فإن المراحل التي تم استعراضها موجودة 
في أ غلب المترجمات. هذا وقد تمت الإشارة في هذا الجزء لعدد من تراكيب البيانات ( Data‏ 
(Structures‏ ا للاحتفاظ e‏ ا eT E‏ 
عش ا که البيانات الأساسية اك ادما المترجم. 


5. تراكيب البيانات الأساسية في المترجم 
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Types of Data Structure in Compilers 


ر ا ا ارک و رک ی 2 
فلك المراخل علاقة فوية غائ شرم #اغذاد المتز جم بخارل أن يطبق :هذه الخراررمجات اكا (لاسايف 
دون أن يؤدي ذلك إلى زيادة التعقيد بقدر كبير وهو ما يتم التعبير عنه بأن المترجم يجب أن يكون لديه 
القدرة على ترجمة البرنامج في الوقت الذي يتناسب مع حجمه وفي هذا الجزء سنقوم بتقديم تراكيب 
البيانات الرئيسية التي يحتاج إليها المترجم في مراحله المختلفة والتي تعتبر جزءَ أساسيا من عملياتها 
وتخدم في نقل المعلومات بينها 


5.. المفردات یہ )ہ7 


عندما يقوم محلل المفردات ) (Lexical Analyzer‏ بتجميع الحروف التي تكون مفردة محددة فانه 
بصفة عامة يتم تمثيل هذه المفردة في شكل قيمة من القيم المحددة التي تمثل مجموعة المفردات الخاصة 
بلغة المصدر وفي بعض الأوقات يكون من الضروري الاحتفاظ بسلسلة الحروف التي تمثل المفردة 
وكذلك بعض المعلومات المشتقة منها مثل الاسم الخاص بالمعرف أو قيمة المفردة الرقمية وفي معظم 
لغات البرمجة يحتاج محلل المفردات إلى توليد مفردة واحدة فقط في كل مرة وفي هذه الحالة فإن متغير 
واحد عام يمكن استخدامه للاحتفاظ بسطومات المفردة٠وفي‏ خالات أخرى مثل لخة الفورتران تستخدم 
مصفو فة للاحتفاظ بمعلومات عن المفردات. 


Syntax Tree شجرة النحو‎ .,.5 


إن محلل الصيغ النحوية يقوم بتوليد شجرة النحو والتي عادة ما يتم إنشاؤها كتركيبة للبيانات قائمة 
على استخدام المؤشرات (ك۲ع†”أم٥)‏ حيث يتم بناءها بشكل مرحلي وفقا لتقدم عملية الإعراب الخاصة 
بشفرة المصدر والشجرة بالكامل يتم الاحتفاظ بها باستخدام متغير واحد يشير إلى جذر الشجرة وكل 

عقدة ( ملهN)‏ في الشجرة عبارة عن سجل ( لك۲هء٥R)‏ تمثل الحقول ( ءل|ع۴) الخاصة بالمعلومات 
التي يتم تجميعها أثناء مرحلة تحليل الصيغ النحوية أو مرحلة تحليل الدلالات فمثلا نوع بيانات تعبير 
رياضي يتم الاحتفاظ به كحقل في داخل عقدة شجرة النحو الخاصة بذلك التعبير وعموماً فإن كل عقدة 
في شجرة النحو قد تطلب خصائص مختلفة لتخزينها وفقا لنوع تركيبة لغة البرمجة التي تمثله فالعقدة 
التي تمثل تعبير رياضي تحتفظ بخصائص تختلف عن الخصائص التي تحتفظ بها العقدة التي تمثل أحد 
الأوامر ولهذا فإن عقد شجرة النحو تختلف في حقولها عن بعضها البعض. 


5. جدول الرموز عاطھ۲ اoمSymb‏ 


هو تركيبة البيانات التي تحتفظ بمعلومات ترتبط بالمعرفات المختلفة من وظائف ) (Functions‏ 
ومتغيرات (ءعاطهه۷) وثوابت (ئامه†ءمهع) وأنواع بيانات (sعمرآ‏ هtة0)‏ وهذا الجدول يتفاعل 
مع جميع مراحل المترجم حيث يتم إنشاء الخانة الخاصة بالمعرف في الجدول أثناء مرحلة تحليل 
المفردات أو مرحلة تحليل الصيغ النحوية ثم تقوم مرحلة تحليل الدلالات بإضافة نوع المعرف وباقي 
المعلومات الخاصة بها علی أن يتم استخدام تلك المعلومات أثناء مراحل تولید وتحسين شفرة الهدف 
ولكون جدول الرموز يتم استخدامه بكثرة خلال عملية الترجمة سواء في الإضافة أو الحذف أو 
الاسترجاع لذلك فان كفاءة القيام بهده المهام تعتبر من الأمور الهامة من أجل كفاءة عملية الترجمة 
بصفة عامة ولهذا فعادة ما تستخدم الجداول العشوائية ( وهاطة طة١)‏ كتركيبة بيانات أساسية لتمثيل 
جدول الرموز لما تتميز بها من كفاءة وسرعة عالية في الإضافة والحذف واسترجاع المعلومات . 
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5. جدول الثوابت ء‌|طTabآ Literal‏ 


إن هذا الجدول يقوم بتخزين الثوابت الحرفية والرقمية المستخدمة داخل البرنامج ولا يحتاج هذا 
الجدول للقيام بحذف للثوابت التي يتضمنها وذلك لكون تلك الثوابت تكون لها صفة العمومية داخل 
البرنامج ككل وليست مرتبطة بجزء محدد من أجزاء البرنامج كما أن كل منها يظهر لمرة واحدة فقط 
داخل الجدول وعموما فإن جدول الثوابت له دور مهم في تخفيض الحجم الذي يشغله البرنامج داخل 
الذاكرة كما أنه يستخدم أثناء مرحلة توليد شفرة الهدف. 


Intermediate Code الشفرة الوط‎ ..5 


حسب نوع الشفرة الوسيطة التي يتم استخدامها ووفقا لنوع التحسين الذي يتم إنجازه فإن هذه الشفرة 
الوسيطة قد يتم الاحتفاظ بها داخل مصفوفة من سلاسل الحروف أو في ملف نصي )٠٥× ۴|٥(‏ مؤقت 
وعموما فان المترجمات التي تقوم بعمليات تحسين معقدة لشفرة البرنامج تعطي أهمية كبيرة لاختيار 
التمثيل الأفضل للشفرة الوسيطة الذي يسهل من عملية التحسين. 


Temporary Files ةتۃؤمnlاl الملفات‎ ,.5 


إن الحواسيب في السابق لم يكن لديها حجم الذاكرة الكافي للاحتفاظ بالبرنامج كاملا في الذاكرة أثناء 
الترجمة ولحل هذه المشكلة فإنه غالبا ما كان يتم اللجوء لاستخدام مجموعة من الملفات المؤقتة للاحتفاظ 
بالمخرجات الوسيطة لكل مرحلة من مراحل الترجمة وعموما فإن القيد الخاص بحجم الذاكرة المحدود 
أصبح غير موجود في هذه الأيام أو على الأقل يمثل مشكلة بسيطة لهذا أصبح من الممكن القيام 
بالترجمة بالكامل داخل الذاكرة دون الاحتياج إلى أي ملفات مؤقتة وخاصة في حالة إمكانية تجزئة 
برنامج المصدر و القيام بترجمة كل جزء على حده . 
له النز ج ة الافتر اض اة 


Sample Programming Language 


إن إعداد مادة علمية خاصة بالمترجمات لا تصبح كاملة بدون إعطاء أمثلة لكل خطوة من خطوات 
عملية الترجمة وفي حالات كثيرة سوف نوضح الأساليب التي نتعرض لها في هذه المادة العلمية 
باستخدام أمثلة من لغات البرمجة القائمة والمعروفة مثل لغة ال ٤‏ وال C++‏ وال اهعئج۴ وال ك۸ 
ولكن هذه الأمثلة تكون غير كافية لعرض كيفية تجميع أجزاء المترجم الخاص بأحد لغات البرمجة 
واستيعابها. وبما أن القيام بذلك الأمر يكون من الصعوبة بالنسبة للغات البرمجة الكاملة لهذا فإن الحل 
aa Eg e e a ES a O E‏ 
المادة العلمية هي لغة برمجة بسيطة وسوف تستخدم ف في الوحدات الثلاثة الأخيرة من تلك المادة العلمية 
لتطبيق المفاهيم التي سيتم عرضها. 


وهيكل البرنامج المكتوب بهذه اللغة الافتراضية يكون بسيطا لكونه يتكون فقط من مجموعة من الأوامر 
يفصل بينهم الفاصلة المنقوطة باستخدام صيغ نحوية مشابهة للصيغ النحوية الخاصة بلغة ال أهعيجم 
وفي تلك اللغة الافتراضية لا توجد إجراءات ( (P٣٥ cd ures‏ أو حتى تعريفlت‏ ) (Declarations‏ 
وجمیع المتغيرات متغيرات صحیحة ( ٤٥ا‏ ھا۷ ٣عeعع†ہا)‏ ولا یتم تعریفھا مقدما بل تأخذ القیم 
الخاصة بها مباشرة كما يحدث في لغة ال اوج8 ويوجد بهذه اللغة أمران مركبان فقط هما أمر أ 
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الشرطي و أمر tجعمهم‏ التكراري وكلا الأمرين يمكن أن يتضمنا عدة أوامر وينتهي أمر ۴¡ بكلمة 
لهه ولدى اللغة الافتراضية أيضا الأمران إجعإ و ماس للقيام باستقبال المدخلات وإعطاء 
المخرجات على التوالي وبالنسبة للتعبيرات الرياضية في هذه اللغة فهي محدودة ومقصورة على 
التعبيرات الصحيحة أو المنطقية والتعبيرات المنطقية تتكون من مقارنة بين تعبيرين رياضيين باستخدام 
عمليتي المقارنة '>' و '=' فقط أما التعبيرات الصحيحة فتشمل الثوابت والمتغيرات الصحيحة والأقواس 
والعمليات الحسابية الأربعة الأساسية '+' و -' و '*"' و '/' وأخيراً فإن تلك اللغة تسمح بإضافة التعليقات 
(ئخenمصصتc)‏ إلى البرنامج على أن تكون محصورة بين الأقواس  [‏ . 


والبرنامج التالي هو برنامج بسيط مكتوب بلغة البرمجة الافتراضية للقيام بحساب المضروب 
(ا2٣ه†عه۴)‏ وهذا البرنامج سوف يستخدم كمتال عبر تلك المادة العلمية: 


{Sample program to compute factorial} 
;read x 

if x > 1 then 

;fact:=1 

repeat 

; fact : = fact * X 

KESEK 

; until x = o 

write fact 


end 
الطرق المعتادة لوصف النحو (الصيغ النحوية)‎ 

في هذا الجزء سيتم استعراض أهم الطرق التي تستخدم لوصف الصيغ النحوية (×ه†"ر؟) الخاصة 
بلغات برمجة الحاسوب والتي يعتمد عليها في عملية الترجمة من لغة المصدر إلى لغة الهدف وذلك لأن 
ترجمة أي برنامج مكتوب بإحدى لغات البرمجة تشمل التأكد من أن هذا البرنامج متوافق مع الصيغ 
النحوية الخاصة بلغة البرمجة المكتوب بها. 
1.. القواعد خالية اlaıJق Context-free Grammars‏ 


هذه القواعد ظهرت في منتصف الخمسينات من القرن الماضي على يد عالم اللغويات كومسكاي 
(ر)sص‌هطع)‏ الذي قام باستخدامها في وصف قواعد اللغات الطبيعية ( es‏ عھںعہ ھا اھا )Natu‏ ولکن 
سرعان ما بدأ إستخدام تلك القواعد في وصف الصيغ النحوية للغات البرمجة حيث ظهر نجاحها بعد 


7 


جامعة النيلين - كلية العلوم/ مدرسة العلوم الرياضية- إعداد / عمر إبراهيم عبدالله Compiler for msc of cs‏ 


ذلك د بعيد و Ss‏ هذه e‏ هي الأساس الذي قامت عليه جميع الأشكال التي 


Backus Naur Fo0ڵm‎ رڙرgi‎ سوکlبڊ‎ Jلکش‎ ..1 


بعد كومسكاي قام جون باكوس ( 8)u‏ ۸طهل) في أواخر الخمسينات من القرن الماضي 
باستخدام شكل جديد لوضع الصيغ النحوية للغة الألجول 58 (58|هع|۸) التي تعتبر من أوائل لغات 
برمجة الحاسوب. هذا الشكل تم إدخال بعض التعدیلات علیھ علی ید بیتر نور ( Nur‏ ٣مtم٥)‏ › وتم 
استخدام الشكل المعدل في وصف لغة الألجول 60 (60 اهعا۸) حيث أصبح هذا الشكل بعد التعديل 
معروف باسم شکل باکوس نور ۴٥۲۳‏ ں۵ ck) us‏ ھ8) »› أو کما یطلق علیھ اختصاراً )8N۴(‏ › وتم 
استخدامه في وصف الصيغ النحوية لأغلب لغات برمجة الحاسوب التي ظهرت بعد ذلك. 


شكل باكوس نور يعطي أسماء مجردة (١٥0†ءه١†ءطA)‏ للتراكيب النحوية التي تتكون منها لغة البرمجة 
فعلى سبيل المثال لوصف أمر التخصيص في لغة الجافا (م۷هل) يتم ذلك كما يلي: 


< assign > <var> = < expression > 


لرن ال جو على الجانت الال مق ال( )هو الام اجره لر كي التخرى المراك تة 
وهو أمر التخصيص في هذه الحالة والمشار له بالإسم المجرد < معأووج> أما باقي التعريف والذي 
يظهر على الجانب الأيمن للسهم ( ) فإنه يتكون في هذا المتال من مجموعة من الرموز (مثل إشارة 
التخصص (=)) والأسماء المجردة الأخرى (<١0اءوع۲م×ه>‏ & <۲ه۷>) والتي يجب أن يتم توصيف 
كلا منها على حده في تعريف منفصل. وخلاصة التعريف السابق هو أن أمر التخصيص في لغة الجافا 
يتكون من متغير (< ۲ه٠>)‏ وتعبير رياضي أو تعبير نصي (< "اوم م»×ه>) وبينهما إشارة 
التخصيص (=) وكما هو واضح من التعريف فإن المتغير لابد أن يكون على يسار رمز التخصيص 
بينما التعبير النصي أو الرياضي فإنه يكون على يمين رمز التخصيص ولكي يكتمل وصف امر 
التخصيص لابد أن يتم توصيف كل من المتغيرات (<ه>) وكذلك التعبيرات (<١0أءوم٣م»×ه)‏ في 
تعريف منفصل لكلا منهم. 


والأمر التالي يوضح مثال لأمر التخصيص في لغة الجافا وفقا للتوصيف الموضح بالتعريف السابق 
باستخدام شکل ال شکل باکوس نور 


Total = Subtotal1 + Subtotal2 


وعموما فإن الأسماء المجردة (0۸اعه١وطA)‏ يطلق عليها رموزا غير نهائية ( اص٥ Non-‏ 
اهصر؟ك) وذلك لأنها تحتاج إلى توصيفها بعد ذلك بينما الرموز فيطلق عليها ( امآ 
(Symbols‏ أي رموز نهائية لآن تعريفها مو 2 إلى و ي کما في چ رمز 

غير النهائية فان 0 المجرد للرمز غير النهائي يتم وضشنغه بین قران (< >) في کل وکین نور. 
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وبصفة عامة فإن التوصيف النحوي باستخدام شكل باكوس نور يتكون من مجموعة من القواعد 
(Rules)‏ وکل قاعدة تقوم بو صف أو تعریف صيغة نحوية او امر محدد في أخة البرمجة ویمکن أن 
يكون هناك عدة تعريفات مختلفة لرمز غير نهائي واحد وذلك للتعبير عن صيغ نحوية مختلفة للرمز في 
لغة البرمجة والتعريف التالي يوضح ذلك عند توصيف آمر ۴| في إحدى لغات البرمجة: 


< if-stmt > if < logic-expr > then < stmt > 


< if-stmt > if < logic-expr > then < stmt > else < stmt > 


ويمكن دمج أكثر من قاعدة نحوية في قاعدة نحوية واحده باستخدام رمز الاختيار ( | ) والتعريف التالي 
يقوم بدمج القاعدتين السابقتين في قاعدة نحوية واحده: 


< if-stmt > if < logic-expr > then < stmt > 


< if < logic-expr > then < stmt > else < stmt | 


وبالرغم من بساطة شكل باكوس نور إلا أنه فعال وكافٍ لوصف جميع الصيغ النحوية الخاصة 
بلغات البرمجة المختلفة بما فيها الصيغ النحوية التي تحتوي على سلسلة أو قائمة (ءا) من التراكيب 
ولأي مستوى أو عمق مع إمكانية توضيح أولوية تنفيذ العمليات (عء ع لعءء۴۲ 0ة مم0) وكيفية 
إتحاد llعlnيlٽ (Operators Associativity)‏ . 
وصف القوائم (ئخءاا) 


إن القوائم مختلفة الطول (ءاءاا ط†ععا عماطهاج۷) تعتبر من النماذج التي يصعب وصفها ولكن 
شكل باكوس نور يستخدم كوسيلة مبتكرة لوصف القوائم التي تحتوي على عدد من العناصر النحوية في 
لغات البرمجة متثل الأمر الخاص بتعريف المتغيرات الذي يحتوي على عدة متغيرات غير محددة العدد 
ويتم تعريفها في أمر واحد داخل البرنامج كالمثال التالي: 


,int Num1, Num2, Num3 
ں) على أنھا متغيرات صحيحة‎ ٣1, u ۳٣2, فالأمر السابق يقوم بتعريف تلاثة متغیرات ( ۳3 ں‎ 
ولكن يمكن في نفس الأمر تعريف عدد من المتغيرات أكثر أو أقل من تلاثة متغيرات و يستخدم شكل‎ 
لوصف القوائم المتغيرة الطول كما في المتال التالي الذي يقوم‎ (Recursion ) باکوس نور التكرار‎ 


بو صف قائمة من ١‏ لمتغير ات" 


< var-list > < var > 
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< var >, < var-list > | 


حيث أن الوصف السابق لقائمة المتغيرات (1ءاا sماطهاة۷)‏ يشمل على تكرار للرمز اللانهائي 
(<اءاا-٣ه۷>)‏ والذي يتم تعريفه لكونه يظهر على يسار السهم ( ) كما يظهر أيضا على يمين السهم ( 
) وهو ما يعني أن هذه القاعدة الوصفية هي قاعدة تستخدم التكرار فأي قاعدة يظهر فيها نفس الرمز 
اللاآنهائي على يسار و يمين السهم ( ( هي قاعدة تكرارية )Recursive Rule)‏ كما في القاعدۃ السابقة 
والتي توضح أن قائمة المتغيرات إما أن تحتوي على متغير واحد فقط أو متغیر يليه الرمز النهائي 
الفاصلة ( , ) ثم قائمة المتغيرات التي يمكن بدورها أن تتكون من متغير واحد أو من متغير يليه قائمة 
من المتغيرات وهكذا لأي عدد من المتغيرات فبهذا الوصف فإن قائمة المتغيرات يمكن أن تتكون من أي 
عدد من المتغيرات بدء من متغير واحد أو أثنين أو ثلاثة أو أكثر. 
القواعد النحوية والاشتقاق: 

إن القواعد النحوية (٣2ة"٣"ه6)‏ تعتبر وسيلة مولدة لتعريف اللغات فأي جملة تحتوي عليها اللغة 
و وا ر ف ی 
رمز البدء ( امطصرك خاه5t)‏ حيث يطلق على هذه العملية عملية الاشتقاق ( "هأاة۷أم0) وبصفة 
عامة فإنه للتأكد من أن أي جملة تنتمي للغة معينة فإنه لابد أن يتم اشتقاق هذه الجملة من القواعد 
النحوية الخاصة باللغة كما يمكن أيضا العكس عن طريق توليد أو اشتقاق جميع الجمل التي يمكن أن 
تنتمي إلى لغة معينة من القواعد النحوية الخاصة بهذه اللغة ولكنها تعتبر عملية صعبة جدا وخاصة عند 
زيادة عدد القواعد النحوية للغة كما في حالة اللغات الطبيعية فمن الصعب حصر جميع الجمل التي 
تنتمي إلى إحدى اللغات الطبيعية كاللغة العربية أو الإنجليزية وذلك لإتساع القواعد النحوية الخاصة بأي 
من هاتين اللغتين. 


E N NSE SR DE AN SA EE 
برمجة بسيطة جدا تم وصفها باستخدام شکل باکوس نور‎ 


program> begin <stmt-list> end> 


<stmt-list> <stmt> 


<stmt> ; <stmt-list> 


<stmt> <var> = <expression> 


var> A | B | C> 


<expression> <var> + <var> 
<var> - <var> 
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<var > | 


ومتثل جميع لغات برمجة الحاسوب فإن رمز البداية ( امطصرك ٤۲ه†5)‏ الخاص بلغة البرمجة 
الموضحة في المثال السابق هو الرمز اللانهائي (<۳ه۲عه۲م>) حيث يستخدم هذا الرمز كرمز بداية 
لجميع لغات البرمجة وتبدأ عملية الاشتقاق من هذا الرمز. 
ولغة المثال السابق تتكون من نوع واحد من الأوامر هو أمر التخصيص حيث أن أي برنامج مكتوب 
بهذه اللغة يبدأ بكلمة ( «أعمط) متبوعة بقائمة من الأوامر يفصل بينها رمز الفاصلة المنقوطة (;) 
وينتهي البرنامج بكلمة (١٠ء)‏ . والتعبير الرياضي ( ١٥اووم۲م»×ع)‏ في هذه اللغة إما أن يتكون من 
متغير واحد فقط أو من متغيرين يفصل بينهما رمز (+) أو رمز (-) واللذان يستخدمان في عمليتي 
الجمع والطرح على التوالي والاسم الخاص بمتغيرات هذه اللغة هي إما (۸) أو (8) أو )٤(‏ ونوضح 
الآن كيفية اشتقاق برنامج من هذه اللغة الب ب لبسبطة: 
program > => begin < stmt-list > end >‏ 
begin < stmt > ; < stmt-list > end <=‏ 
begin < var > = < expression > ; < stmt-list > end <=‏ 
begin A = < expression >; < stmt-list > end <=‏ 
begin A = < var > + < var > ; < stmt-list > end <=‏ 
begin A = B + < var >; < stmt-list > end <=‏ 
begin A = B+ C; < stmt-list > end <=‏ 
begin A= B+ C; < stmt > end <=‏ 
begin A = B + C; < var > = < expression > end <=‏ 
begin A= B+C; B =< expression > end <=‏ 


begin A= B+C; B=<var > end <= 


begin A= B+C; B=Cend <= 
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ويلاحظ أن الاشتقاق يبدأ من رمز البداية الخاص باللغة (<"۳هإعهإم>) ورمز الاشتقاق ( <= ) 
يستخدم للانتقال من تركيبة إلى التركيبة التي تليها في عملية الاشتقاق وفي كل خطوة يتم استبدال أحد 
الرموز اللانهائية التي تحتوي عليها التركيبة بأحد التعريفات الخاصة به كما توضحه القواعد النحوية 
للغة وفي جميع الأحوال يتم في كل خطوة استبدال الرمز اللانهائي الذي يقع في أقصى يسار التركيبة 
للانتقال إلى الخطوة التالية وهو ما يسمى اشتقاق من أقصى اليسار ( Derva ti٥‏ †ئMo-Left)‏ حیث 
يستمر الاشتقاق وحتى الوصول إلى تركيبة لا تحتوي على أي رموز غير نهائية وتحتوي بالكامل على 
مجموعة من الرموز النهائية فقط فعندها ينتهي الاشتقاق وتظهر الجملة أو البرنامج في حالة لغات 
البرمجة) التي تم اشتقاقها أو توليدها من القواعد النحوية الخاصة بهذه اللغة. 

ویمکن أن یتم الاشتقاق من أقصی الیمین ( )Right-Most Derivation‏ أي باستبدال الرموز 
اللانهائية من اليمين إلى اليسار أو بأي ترتيب أخر دون أن يؤثر ترتيب الاشتقاق على اللغة التي يتم 
اشتقاقها من القواعد النحوية الخاصة بهذه اللغة ولكن الاشتقاق من أقصى اليسار هو أكثر أنواع 
الاشتقاق استخداما. 


وفيما يلي مثال آخر يوضح القواعد النحوية الخاصة بجزء بسيط من إحدى لغات البرمجة : 


< assign > < var > = < exp > 
var> A| B| C> 
< eXp > <var > + < exp > 

< var > * < exp > | 

< exp > | 

var > |‏ < 
وهذه القواعد تقوم بوصف أمر التخصيص الذي يحتوي الجانب الأيمن منه على تعبير رياضي يستخدم 
عملية الجمع والضرب وكذلك الأقواس وعلى سبيل المثال أمر التخصيص التالي: 


(A= B * (A+C 


يمكن توليده من القواعد السابقة عن طريق الاشتقاق من أقصى اليسار. 


< assign > => < var > = < exp > 
<A=<exp <= 
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<A=<var > * < exp <=‏ 
<A=B*<exp <=‏ 
(<A=B* (<exp <=‏ 
(<A=B* (<var >+ < exp <=‏ 
(<A=B*(A+<exp <=‏ 
(<A=B*(A+<var <=‏ 
(A=B*(A+C <=‏ 
استخدام شجرة الإعراب (Using the Parse Tree)‏ 
من خصائص القواعد النحوية إمكانية وصف الهيكل النحوي لجمل أي لغة من اللغات في شكل 
هرمي وذلك باستخدام ما يسمى بشجرة الإعراب ۲۲٠٠(‏ ه٠ه۴)‏ فعلى سبيل المثال فإن الشكل التالي 


يوضح الهيكل النحوي لأمر التخصيص الذي تم اشتقاقه في المثال السابق وذلك باستخدام شجرة 
الإعراب التالية: 


ويلاحظ أن كل عقدة من العقد الداخلية (sمله.‏ اهم ٣هم|)‏ لشجرة الإعراب يتم عنونته بأحد الرموز 
اللانهائية بينما العقد الخارجية (وعمله. اهمإم†»ع) أو ما يطلق عليها العقد الورقية (Leaf Nodes)‏ 
فإنها تعنون بأحد الرموز النهائية. 
غموض القواعد النحوية ( ity‏ uں‌عAmbi()‏ : 
اذا كانت القواعد النحوية لأي لغة من اللغات تمكن من إنشاء أكثر من شجرة إعراب واحدة لأي من 
الجمل المشتقة من هذه اللغة فان هذه القواعد تعتبر قواعد خامnضة‏ ) (Ambiguous‏ ولتوضیح ذلك 
فالمثال التالي يقوم. بعررض نفس القراعد النحوية الخاصة بأمر التخضيض الموضح في المثال السابق 
ولكن بعد إجراء بعض التعديلات البسيطة عليه: 
assign > < var > = < exp >‏ < 
Var> A| B| C>‏ 
eXPp > <eXxp > +< exp >‏ < 

< exp > * < exp > | 
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( < exp > )| 


< var > | 


فهذه القواعد النحوية الخاصة بأمر التخصيص في شكلها الأخير تعتبر قواعد غامضة وذلك لأن الجملة 
التالية: 


A=B+C*A 


وهي الجملة التى يمكن اشتقاقها من القواعد النحوية السابقة يمكن أن يتم إنشاء شجرتي إعراب لها 
كالموضحين في الشكل التالي مما يعني أن القواعد النحوية التي تم اشتقاق أو توليد هذه الجملة منها هي 


وغموض القواعد النحوية لأي لغة من اللغات يعتبر مشكلة بالنسبة للمترجم الذي يعتمد بشكل كبير 
غل عن لت الفا عة انحر الخاصة اة ف اتر جة هن هذ الل الي اللات الأخرى 
وخاصة إذا ما عرفنا أن المترجم الخاص بأي لغة يستخدم شجرة الإعراب الخاصة بكل تركيبة أو جملة 
مشتقة من هذه اللغة فى توليد الترجمة المقابلة لهذه التركيبة أو الجملة فى اللغة الأخرى فإذا كانت هناك 
أكثر من شجرة إعراب واحدة لأي جملة أو تركيبة في اللغة فإن المترجم الخاص بهذه اللغة لا يستطيع 
القيام بالترجمة لعدم إمكانية تحديد ترجمة مقابلة وحيدة لهذه الجملة أو التركيبة وهي المشكلة التي سيتم 
مناقشتها بالتفصيل في الأجزاء التالية. 
أولویات تiفيذ‏ llعمlٹيlٽ (Operators Precedence)‏ : 


كما ذكرنا سابقا فإن القواعد النحوية تستطيع عند وصف التراكيب المختلفة لأي لغة من اللغات تقديم 
بعض الإيضاحات أوالدلالات لشجرة الإعراب المقابلة لكل تركيبة وهو ما يظهر بوضوح عند تحديد 
أولويات تنفيذ العمليات الحسابية المختلفة من جمع وطرح وضرب وقسمة داخل أي تعبير رياضي لأن 
العملية الحسابية التي تظهر في شجرة عرزت فی موی ای کون ا رارت کے اف کن 
العمليات الحسابية التي تظهر في مستوى أعلى ففي شجرتي الإعراب السابقتين نجد أن عملية الجمع لها 
أولوية في التنفيذ بحيث تسبق عملية الضرب في شجرة الإعراب التي تظهر في الجانب الأيمن بينما في 
شجرة الإعراب التي تظهر في الجانب الأيسر تكون عملية الضرب لها أولوية في التنفيذ عن عملية 
الجمع وذلك لأن عملية الجمع تظهر في شجرة الإعراب اليمنى في مستوى أدنى من مستوى عملية 
الضرب بينما في شجرة الإعراب اليسرى تظهر عملية الضرب في مستوى أدنى من مستوى عملية 
الجمع ومن هذا نستطيع فهم مدى الغموض والتعارض في المعلومات المستنتجة من كلا الشجرتين على 
الرغم من أنهما يعكسان الهيكل النحوي لأمر تخصيص واحد ولكنه مشتق من قواعد نحوية غامضة. 


والقواعد النحوية لأي لغة يمكن أن تعطي جميع العمليات الحسابية نفس الأولوية في التنفيذ وتكون 
الأولوية فقط في التنفيذ لترتيب ورود العملية الحسابية داخل التعبير الرياضي بحيث يتم تنفيذ العمليات 
بالترتيب من اليمين إلى اليسار أو من اليسار إلى اليمين وذلك حسب طريقة تعريف التعبير الرياضي 
ولكن يمكن أيضا للقواعد النحوية عند تعريف الهيكل الخاص بالتعبير الرياضي أن نقوم بتحديد الأولوية 
الخاصة بكل عملية حسابية بغض النظر عن ترتيب ورودها داخل التعبير الرياضي وذلك عن طريق 
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إعطاء اسم مجرد مختلف لأطراف كل عملية حسابية لها أولوية تنفيذ مختلفة وهو ما سيتضح في المثال 
التالي: 
assign > < var > = < exp >‏ < 
var> A| B| C>‏ 
eXp > <eXxp >+ <term >‏ < 
term > |‏ < 
term > < term > * < factor >‏ < 
factor > |‏ < 
factor > (< exp >‏ < ( 


< var > | 


والاشتقاق الخاص لأمر التخصيص التالي: ۸=8+٤*۸‏ 

يكون كما يلي وفقا للقواعد النحوية الخاصة بتعريف أمر التخصيص بشكلها الأخير: 
assign > => < var > = < exp >‏ < 

<A=<exp <= 

<A=<exp >+<term <= 

< A= <term > + < term <= 

< A= < factor > + < term <= 

< A=<var >+ < term <= 

< A=B+<term <= 

< A= B+ <term > * < factor <= 


< A=B + <factor > * < factor <= 
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< A = B+ < var > * < factor <= 
<A=B+C* <factor <= 
<A=B+C*<var <= 
A=B+C*A <= 


وشجرة الإعراب الوحيدة المقابلة لأمر التخصيص السابق تكون كما يلي: 


حيث يتضح مدى التماثل أو التقارب بين الاشتقاق الخاص بأمر التخصيص المبين في المثال السابق 
وبين شجرة الإعراب المقابلة لنفس المثال كما يظهر أولوية تنفيذ عملية الضرب عن عملية الجمع لأن 
عملية الضرب تظهر في مستوى أدنى في شجرة الإعراب عن عملية الجمع وذلك كنتيجة لتحديد 
أولويات تنفيذ العمليات الحسابية في القواعد النحوية الخاصة بتوصيف أمر التخصيص في شكلها 
الأخير. 

وكملاحظة أخيرة فإن كل عملية اشتقاق ناتجة من قواعد نحوية غير غامضة يقابلها شجرة إعراب 
وحيدة ولكن العكس غير صحيح لأن شجرة إعراب واحدة يمكن أن تقابل عددا من عمليات الاشتقاق 
المختلفة لنفس الجملة أو التركيبة وذلك لوجود عدة طرق مختلفة لاشتقاق الجملة أو التركيبة حسب 
ترتيب عملية الاشتقاق من أقصى اليسار أم من أقصى اليمين أو بأي ترتيب آخر ولتوضيح ذلك فإن 
الاشتقاق التالي لنفس أمر التخصيص المعطى في المثال السابق ولكنه في هذه المرة اشتقاق من أقص, 
اليمين وليس من أقصى اليسار كما في المرة السابقة: 
assign > => < var > = < eXpþ >‏ < 
var > =< exp >+ <term > <=‏ < 
var > =< exp > + < term > * < factor > <=‏ < 
var > =< exp >+ < term > * < var > <=‏ < 
var > =< exp >+ <term > * A > <=‏ 
var > = < exp > + < factor > * A > <=‏ 


var >=<exp >+ <var> * A > <= 


var > =<eXxp>+C*A > <= 
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var >= <term >+C*A > <= 
var > = < factor >+ C* A > <= 
var > =<var>+C*A > <= 
var>=B+C*A > <= 


A=B+C*A <= 


ولكن مع ذلك فإن هذا الاشتقاق الأخير يقابله نفس شجرة الإعراب السابقة. 
lتحاد‏ اlعlnٹlıٽ (Associativity of Operators)‏ 


إن قدرة القواعد النحوية على وصف الإتحاد الخاص بالعمليات في التعبيرات بشكل سليم يعتبر أيضا من 
الخصائص الهامة لهذه القواعد وذلك لأن صحة وصف إتحاد العمليات تنعكس على شجرة الإعراب عند 
تمثيل تعبير يحتوي على عدد من العمليات المتجاورة التي لها نفس الأولوية في التنفيذ ففي هذه الحالة 
فإن طريقة إتحاد كل عملية مع أطرافها تحدد ترتيب تنفيذ هذه العمليات المتجاورة وأمر التخصيص 


A=B+C+A 


فوفقا للقواعد النحوية لأمر التخصص بشكلها الأخير الذي يوضح أولوية تنفيذ ١‏ لعمليات فان شجرة 
الإعراب التي تمتل أمر التخصيص في المثال السابق تكون كما يلي: 


حيث يتضح من شجرة الإعراب السابقة ووفقا لقاعدة أن العملية التي تظهر في مستوى أدنى في 
شجرة الإعراب يكون لها أولوية في التنفيذ عن العملية التي تظهر في مستوى أعلى لذلك فإنه في المتال 
السابق يتم تنفيذ عملية الجمع اليسرى في التعبير الرياضي قبل عملية الجمع اليمنى أي أن ترتيب التنفيذ 
يكون من اليسار إلى اليمين عند ورود عدة عمليات جمع متجاورة داخل التعبير الرياضي وهو 
المتعارف عليه بالنسبة لعمليات الجمع أو الطرح أو الضرب أو القسمة وهو ما يطلق عليه إتحاد من 
ناحية اليسار أو إتحاد يساري (ع۷أاةاءمءءA )1٠۴‏ وهو المستخدم مع الحاسوب وبالنسبة لعملية الجمع 
فإنه من المعروف أن نوع الإتحاد سواء كان إتحاد يساري أو إتحاد يميني ( اها هءءA‏ خ٣عRİ)‏ فإن 
نتيجة عملية الجمع لن تختلف وذلك لأن عملية الجمع من الناحية الرياضية عملية متعادلة إتحادي) 
)Ass0ciative Operator)‏ وهو ما يعبر عنه کما یلي: 


(A+B)+C=A+(B+C) 
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ونفس الشيء بالنسبة لعملية الضرب ولكن الأمر يختلف بالنسبة لعمليتي الطرح والقسمة لأنهما عمليات 
غير متعادلة إتحادياً. 


ويتم التعبير عن نوع الإتحاد في القواعد النحوية بحسب موضع تكرار الرمز اللانهائي في القاعدة 
النحوية التكرارية والتي يظهر فيها نفس الرمز اللانهائي على جانبي التعريف فإذا ظهر الرمز اللانهائي 
المتكرر في بداية الجانب الأيمن من القاعدة النحوية فهذا يعني أن اتحاد العملية يساري مثل القاعدة 
النحوية التالية : ٠‏ 


< exp> <exp >+ < term > 
< term > | 


والتي يظهر فيها الرمز اللانهائي المتكرر < م×م > في بداية الجانب الأيمن للقاعدة وبالتالي يقوم 
بوصف إتحاد عملية الجمع على أنه إتحاد يساري ولكن إذا ظهر الرمز اللانهائي المتكرر في نهاية 
الجانب الأيمن من القاعدة النحوية فهذا يعني أن إتحاد العملية يميني مثل القاعدة النحوية التالية: 


< factor> " < exp > ** < factor > 

| <exp> 

والتي توضح أن الإتحاد الخاص بعملية رفع الأس ( "اهن" م”مم»ع) هو إتحاد يميني أي أن 
عمليات الأس المتجاورة يتم تنفيذها من اليمين إلى اليسار وليس العكس كما في حالة عمليات الجمع 
والطرح والضرب والقسمة وذلك يتضح من القاعدة النحوية السابقة حيث يظهر الرمز اللانهائي المتكرر 
<اه†عهf>‏ في نهاية الجانب الأيمن للقاعدة. 

1. شکل باکوس نور الموسع 


(Extended Backus FE Naur Form ( EBNF 


بسبب بعض الإضافات التي تمت على شکل باکوس نور» فإنه یظھر ما یسمی بشکل باکوس نور 
المعدل أو الموسع وهو ما يطلق عليه اختصارا ( ١۴‏ 8ع) وعموما فإن هذه الإضافات لم تؤثر على 
القوة الوصفية لشكل باكوس نور والتي ظهرت لنا في الجزء السابق ولكن هذه الإضافات كانت فقط 
لتسهيل عملية كتابة القواعد النحوية بهذا الشكل الجديد وكذلك تسهيل عملية قراءتها واستيعابها . ويمكن 
حصر الإضافات الشائعة الإستخدام في ثلاثة إضافات أساسية: 


- أول إضافة هي إستخدام الأقواس ( [ ] ) للدلالة على أن ما بداخلها هو جزء اختياري في الصيغة 
النحوية التي يتم وصفها فمتلا لوصف أمر ¡ ۴ الشرطي تكون القاعدة النحوية كما يلي : 
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[x<if-Stmt> if < logicElexpr > then < stmt > [ else < stmt > 


القاعدة السابقة توضح أن الجزء الأخير من أمر ¡ ۴ هو جزء اختياري وهو ما كان يحتاج في شكل ال 
۴ 8 الأساسي إلى وصف ذلك في أكثر من قاعدة نحوية وليست قاعدة نحوية واحدة كالموضحة في 
اال الاق 


- الإضافة الثانية هي استخدام الأقواس ( ) لتوضيح التكرار بدلا من اللجوء إلى القواعد النحوية 
التكرارية وذلك يمكن من وصف القوائم في قاعدة نحوية واحدة دون الحاجة إلى استخدام عدة قواعد 
نحوية للقيام بذلك فمثلاً لوصف قائمة المتغيرات ( < var-list‏ < ( فإنه يكفي لذلك القاعدة النحوية 
التالية: 


{ <var Bl list > < var> {, < var > 


وهو ما يعني أن قائمة المتغيرات عبارة عن متغير واحد وقد يتبعه أي عدد من المتغيرات يفصل بينها 


اللإضافة الثالثة كانت لوصف عدة بدائل للاختيار من بينها حيث يتم وضع مجمو عة الاختيارات بين 
قران( )واف با برل لاخر ر ن راا التحرية اا تطمر كف الام رلك 


< term > <term >(* | / | %) < factor > 


حيث توضح إمكانية الاختيار بين تلاثة بدائل ( * أو / أو % ) و ذلك يتطلب وجود قاعدة نحوية 


والآن أصبحت الأقواس بأشكالها المختلفة ( [ ] و [) و ) جزء من الأدوات الوصفية لشكل باكوس نور 
المعدل وليست رموزآ نهائية كما كانت في شكل باكوس نور وتكمن المشكلة عند الاحتياج لاستخدام هذه 
الأقواس في الصيغ النحوية الخاصة بأحد اللغات ولكن هذه المشكلة يمكن التغلب عليها عن طريق وضع 
هذه الأقواس بين علامات التنصيص ( - )١‏ عند الاحتياج لاستخدامها كرمز نهائي وللتميز بينها وبين 
استخدامها كأداة وصفية في شكل باكوس نور المعدل. 


وبالإضافة للإضافات الثلاثة الشائعة الاستخدام لشكل باكوس نور المعدل والتي تم توضيحها في 
العرض السابق يوجد بعض الإضافات الأخرى غير شائعة الاستخدام. هذا وقد تم حصر جميع 
الإضافات وإعداد القائمة الموحدة لشكل باكوس نور الموسع في نهاية عام1996 م ولكن لا يستخدم 
جميع عناصر القائمة الموحدة. 

Attribute Grammar ةيصئlصفخلنا القواعد‎ . 


تعتبر القواعد النحوية الخصائصية امتداداً للقواعد خالية السياق ولكن تتميز عنها في نها تمكن من 


وصف تراكيب لغات البرمجة بشكل أفضل وخاصة أن بعض خصائص التراكيب البرمجية يصعب 
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(ityاCompatibi‏ eمرآ)‏ للبيانات فمتلاً في لغة الجافا لا يسمح بتخزين قيمة كسرية داخل متغير 
خاص بالقيم الصحيحة على الرغم من أن العكس مسموح به . فقاعدة مثل هذه يكون من الصعب وصفها 
باستخدام شكل باكوس نور وأيضا نجد أن وصف الشرط الخاص بضرورة تعريف المتغيرات قبل 
استخدامها داخل أي برنامج فإنه من المستحيل وصف هذا الشرط باستخدام شكل باكوس نور أو حتى 
فكل باكرن رامعل و بضفة عامة فان هذه التو ية من الخصائص تبي لما يسمي بقراعد الدلالات 
الساكنة( "مك ءiاه†S‏ ) ويطلق عليها ذلك الاسم لارتباطها وإن كان بشكل غير مباشر بدلالات 
البرنامج ولكن بسبب إمكانية تحديدها قبل البدء في تنفيذ البرنامج لذلك سميت دلالات ساكنة والتي 
يحب ار ف بتكل وها با كل بكرن دورو للف فد ا ا ااه الحا 
في تهاية الشات سن لرن الماضي سئي لمكن ين وضفة الضيع:النحرية 'الخاضة بلغا البرهجة 
المختفة بها تة من دلالات اة 


والقواعد النحوية الخصائصية هي قواعد نحوية معتادة مثل القواعد الخالية السياق ولكن بعد إضافة عدد 
من الخصائص إليها بعض هذه الخصائص يتعلق بوصف الدلالات الساكنة والبعض الآخر يستخدم 
لتحديد كيفية حساب القيم الخاصة بكل خاصية وسوف يتم توضيح تلك الخصائص في الأجزاء التالية . 


2 كيفية تعريف القواعد الخصائصية 


المثال البسيط التالي الذي يوضح كيفية استخدام القواعد الخصائصية في وصف الدلالات الساكنة. 
وهو عبارة عن وصف القاعدة الخاصة بإحدى اللغات التي تشترط أن ينتهي كل أجرlء (Procedure)‏ 
داخل البرنامج باسم يتطابق مع الاسم الخاص بالإجراء والذي يتم تحدیده مع بداية تعريف او الإجراء 
حيث يستخدم الرمز اللانهائي < مصهم-عهإم> للتعبير عن اسم الإجراء بينما الخاصية < -ع0ام 
عstrin‏ .< مصهم فإنها تستخدم للدلالة عن قيمة الحروف الخاصة بهذا الاسم وللتفرقة بين الرمز 
اللاآنهائي > proc-name‏ > عند ذكره عدة مرات داخل القاعدة النحوية فإنه يتم ترقیم الرمز برقم 
مختلف في كل مرة يذكر فيها بالقاعدة النحوية مع الملاحظة أن هذا الترقيم ليس جزءاً من الصيغة 
النحوية نفسها وفي هذه الحالة فإن القاعدة النحوية الخصائصية تكون كما يلي: 


[syntax rule : < proc-def > procedure < proc-name >[ 1‏ 
proc-body >‏ < 
[end < proc-name >[2‏ 
predicate : < proc-name >[1].string‏ = = 
proc-name >[2].string >‏ 
ففي المثال السابق نجد القاعدة النحوية الثانية ( عانم ةأ م۲م) وهي التي تستخدم الخاصية ع ا٣ء‏ 
للدلالة عن قيمة اسم الإجراء والتي تعتبر أحد خصائص الدلالات الساكنة وذلك لاشتراط أن اسم 


الإجراء لابد أن يتطابق عند بداية تعريف الإجراء مع الاسم المذكور عند نهاية التعريف. ونقدم الآن 
مثال آخر آكبر وأكثر شمولا للقواعد النحوية الخصائصية حيث يتضح من هذا المثال مدى إمكانية 
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استخدام القواعد الخصائصية في تأكيد التوافق النوعي للبيانات وذلك من خلال تعريف أمر التخصيص 
البسيط التالي: 


< assign > < var > = < exp > 
< exp > <var> + < var > 
< var > | 


var> A| B| C> 


فالتعريف السابق عبارة عن قاعدة نحوية مجرده لا تتضمن أي دلالات ساكنة حيث يظهر من التعريف 
أن الجانب الأيمن لأمر التخصيص إما أن يكون متغير بسيط أو أن يكون تعبير رياضي أما الجانب 
الأيسر فلا بد أن يكون متغير والمتغيرات في التعريف إما أن تكون ۸ أو 8 أو ع أما التعبير الرياضي 
فهو على شكل متغير يضاف إلى متغير آخر ونريد الآن إضافة بعض الخصائص للتعريف السابق 
لتوضيح أن المتغيرات يمكن أن تكون من أحد نوعين أما أن تكون متغيرات صحيحة ( erعمtم|‏ 
sەاطهiا۷a)‏ تقبل القيم الصحيحة فقط أو تكون متغيرات حقيقية ( وعم اهأ ة۷ اجعم8) أي تقبل القيم 
الكسرية و عندما يكون هناك متغيران في الجانب الأيمن لأمر التخصيص ليس من الضروري أن يكونا 
من نفس النوع وعند ذلك يكون نوع التعبير الرياضي حقيقي وهو ما يعني أن ناتج التعبير الرياضي 
يكون كسري آما إذا كان المتغيران من نفس النوع سواء صحيح أو حقيقي قإن التعبير الرياضي يكون 
أيضا متلهما إما صحيح أو حقيقي على التوالي وفي جميع الأحوال لا بد أن يكون نوع المتغير الذي على 
يسار أمر التخصيص من نفس نوع التعبير الرياضي أو المتغير الذي على يمين أمر التخصيص فلا بد 
أن يكون طرفي آمر التخصيص الاأيمن و الأيسر من نفس النوع ليكون أمر التخصيص سليما لذلك 
سوف نستخدم القواعد النحوية الخصائصية للتعبير عن الدلالات الساكنة المشار إليها عن طريق إضافة 
بعض القواعد الدلالية ( sعاںR‏ ءأ†مة"م؟) للتعريف السابق وستشمل تلك القواعد المضافة خاصيتان 
يرتبطان بالرموز اللانهائية. 


الخاصية الأولى تتعلق بالنوع الفعلي (عمرآ اهں†ء۸) وهي خاصية ترتبط بالرمز اللانهائي لكل من 
المتغير( < جر > ) والتعبير الرياضي ( < م×ه > ) وتستخدم لتخزين النوع الفعلي لكلا منهما والتي 
إما أن تكون صحيحة( "| ) أو تكون حقيقية ( اه٠‏ ) في هذا المثال والتي يتم تحديدها لكل من المتغير 
أو التعبير الرياضي من خلال نوع الأطراف المتفرعة منهما في شجرة الإعراب. 


أما الخاصية الثانية فتتعلق بالنوع المتوقع لع†ءعمم×ع) (ءمرآ للتعبير الرياضي ( < م×م >) 


وهي خاصية موروثة ( عا ںطا٣ A‏ dءاا٣عاما)‏ يتم تحديدها وفقا لنوع المتغير الذي يظهر على يسار 
أمر التخصيص والذي إما أن يكون صحيح ( ”| ) أو حقيقي ( اجا ). 


وفيما يلي نقدم النص الكامل للقواعد النحوية الخاصة بأمر التخصيص بعد إضافة القواعد الدلالية التي 
تعبر عن الدلالات الساكنة السابق شرحها: 
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<syntax rule : < assign > < var> = < exp -1 
semantic rule : < exp>. expected-type <var>.actual-type 
[syntax rule : < exp> <var> [2] + <var>[3 -2 
semantic rule : < exp> . actual Bl type — 
(if ( < var> [2] . actual-type = int 
(and (< var> [3]. actual —- type = int 
then int 
else real 
predicate : <exp>.actual-type = = <exp>.expected-type 
<syntax rule : <exp> <var -3 
semantic rule : <exp>.actual-type <var>.actual-type 
predicate: <exp>.actual-type = = < exp>.expected-type 
syntax rule : <var> AI BIC -4 
(semantic rule: <var>.actual-type look-up(<var>. string 
تقوم بالبحث داخل جدول الرموز عاطھ† اما" رء) ) الخاص بالبرنامج‎ |٥٥) -۔ںp ونلاحظ أن الوظيفة‎ 
۸ = ( عن المتغير المحدد باسمه والعودة بنوع هذا المتغير وشجرة الإعراب التالية تمثل أمر التخصيص‎ 
: المشتق من القواعد النحوية الخصائصية السابقة‎ )4 +8 
والشكل التالي يوضح نفس شجرة الإعراب السابقة ولكن بعد إضافة الخصائص المستخدمة في القواعد‎ 


الدلالية والمسار الخاص بكيفية الإستدلال عن القيمة الخاصة بكل خاصية والموضوع على الشكل 
باستخدام الخطوط lئnتقÙطعة (Dashed Lines)‏ 
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وفيما يلي الخطوات الخاصة بتحديد قيمة كل خاصية من الخصائص المستخدمة في القواعد الخصائصية 
السابقة مرتبة وفقا لترتيب تنفيذها: 


)4 (من القاعدة‎ (var>.actual-type look-up(A> -1 


)1 (من القاعدة‎ exp<.expected-type <var>.actual-type> -2 


)4 (من القاعدة‎ (var>[2].actual-type look-up(A> -3 
)4 (من القاعدة‎ (var>[3]. actual-type look-up(B> -4 
(من القاعدة2)‎ exp>.actual-type int or real> -4 


>exp>.expected-type> -5‏ = = type-اexp<.actua‏ (من القاعدة2) 


حيث يلاحظ أن ترتيب تنفيذ الخطوات يسير داخل شجرة الإعراب من أسفل إلى أعلى في اتجاه 
المسار الموضح بالخطوط المتقطعة وأن القيمة الخاصة بالخطوة الأخيرة إما أن تتحقق في حالة تساوي 
النوع الفعلي للتعبير الرياضي مع النوع المتوقع له وإما أن لا يتحقق في حالة عدم حدوث هذا التساوي 
ونفرض أن نوع المتغير ۸ هو متغير حقيقي ( اه ) ونوع المتغير 8 هو متغير صحيح ( |١٤‏ ) فإن 
شجرة الإعراب بشكلها الأخير سيكون كما يلى بعد إجراء الخطوات السابقة وتحديد القيمة الخاصة بكل 
خاضة هن الخضانضن الو تة عل جر ة الغ ات اة 


حيث يتضح من الشكل تحقق التساوي بين كل من النوع المتوقع والنوع الفعلي للتعبير الرياضي مما 
يعني تحقق الشرط الخاص بالتوافق النوعي لأمر التخصيص والموضح بالقواعد الدلالية التي تعكس 
الدلالات الساكنة لأمر التخصيص في المثال السابق. 


وعموما التحقق من القواعد الدلالية الساكنة في أي لغة يعتبر من الأجزاء الأساسية لجميع 
المترجمات فإذا كان الشخص القائم بكتابة المترجم ليس لديه صعوبة في التعامل مع القواعد النحوية 
الخصائصية فإنه يستطيع استخدام أفكارها الأساسية لتصميم الجزء الخاص بهذا التحقق من الدلالات 
الساكنة للغة ولكن من أهم صعوبات استخدام القواعد الخصائصية في وصف القواعد النحوية والدلالية 
لأي لغة برمجة حقيقية هو حجمها وتعقيدها وخاصة أن زيادة عدد الخصائص والقواعد الدلالية 
المصاحبة لها يجعل هذه القواعد صعبة في كتابتها وكذلك قراءتها بالإضافة إلى صعوبة تتبع القيم 
لغاش ت الان کک کی رة ا کرت ای تم ا ا اک کل ذاق ل در رو ت 
وكتابة المترجم يفضل اللجوء إلى استخدام قواعد خصائصية أقل تعقيداً مع الاستعانة بأدوات مساعدة 
سهلة في كتابة المترجم عن إستخدام قواعد خصائصية معقدة لا تمكنه من استخدام مثل هذه الأدوات 
المساعدة. 
3. وصف دلالات البرامج 
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في هذا الجزء نتحول إلى المهمة الصعبة الخاصة بوصف الدلالات المتغيرة ) Dynamic‏ 
5 صمهS)‏ والتي يتم فيها تحديد معنى التعبيرات والأوامر والوحدات البرمجية المختلفة وهي المهمة 
التي يعتبر وصف الصيغ النحوية بالنسبة لها مهمة سهلة وذلك لتوافر الوسائل والطرق الخاصة بوصف 
الصيغ والقواعد النحوية وهي الشيء غير المتوفر بالنسبة لوصف الدلالات المتحركة فلا يوجد طريقة 
واحدة مقبولة ومتفق عليها للقيام بذلك وقد تم تسمية هذا النوع من الدلالات بالدلالات المتحركة لأن 
مدلولها لا يتم تحديده إلا عند تنفيذ البرنامج وليس قبل ذلك وأيضا للتفرقة بينها وبين الدلالات الساكنة 
)Static Seman cs(‏ التي تم شرحها في الجزء السابق والتي يتم تحديد مدلولها أثناء عملية الترجمة 
وقبل البدء في تنفيذ البرنامج وبصفة عامة فإنه غالبا ما يطلق على الدلالات المتحركة لفظ دلالات فقط 
دون تحديد أنها متحركة وذلك لأن الأصل في الدلالات أنها متحركة ويتم تحديدها أثناء تنفيذ البرامج. 


وهناك عدة أسباب للاهتمام بدلالات البرامج أول هذه الأسباب أن المبرمجين يحتاجون لمعرفة 
الوظيفة الخاصة بكل أمر أو وحدة برمجية حتى يتمكنون من كتابة البرامج وغالباً ما يستعينون في ذلك 
على قراءة الشرح المدون في الدليل الخاص باللغة والذي يكون مكتوبا باللغات الطبيعية سواء الإنجليزية 
أو الفرنسية أو حتى العربية ولكن هذا الشرح قد يكون غير كامل وغير محدد. أما السبب الآخر للاهتمام 
بدلالات البرامج وهو السبب الذي يعنينا الآن هو أن القائمين بكتابة المترجمات يحتاجون أيضا إلى فهم 
الدلالات الخاصة بكل جزء من أجزاء اللغة الذي يقومون بإعداد المترجم الخاص بها ولصعوبة وتعقيد 
الوصف الرسمي لهذه الدلالات يكون اللجوء للوصف غير الرسمي باللغات الطبيعية ولهذا توجد العديد 
من الأبحاث في هذا الاتجاه تهدف إلى توفير أسلوب واضح يمكن الاعتماد عليه في وصف مثل هذه 
الدلالات البرمجية بشكل رسمي وذلك لتسهيل مهمة القائمين بكتابة المترجمات وأيضا المبرمجين. 


وبصفة عامة يوجد ثلاثة طرق أساسية لوصف دلالات البرامج حيث تقوم الطريقة الأولى والتي 
تسمى بطريقة الدلالات التشغيلية ( وخ" Sena‏ اnaها†a٬مم0)‏ بوصف معاني تراكيب اللغة عن 
طريق تأثير كل منها على حاسوب افتراضي. أما الطريقة الثانية والمسماة بطريقة الدلالات البديهية 
Semantics(‏ aticصدA»i)‏ فهي طريقة تقوم باستخدام المنطق الرياضي والتي يعد وسيلة لإثبات مدى 
صحة البرامج والطريقة الثالثة والتي تسمى طريقة الدلالات الرمزية (Denotational Semantics)‏ 
فهي تعتمد على تمثيل معاني تراكيب اللغة باستخدام الرموز الرياضية حيث يتم هذا التحويل لعناصر 
اللغة إلى مجموعة من الرموز الرياضية عن طريق عدد من الوظائف التكرارية ( عvأيuءمR‏ 
56ا )۴Un e‏ وسوف نكتفي في هذا الجزء بعرض الطريقة الأولى فقط بشيء من التفصيل. 


3. الدلالات التشغيلية 


الفكرة الأساسية لهذه الطريقة كما أشرنا سابقا هي القيام بوصف معنى البرنامج عن طريق القيام 
بتنفیذ خطوات أو اوامر البرنامج على جهاز حاسوب سواء حقيقي أو افتراضي حيث يتم تحديد المعنى 
أو المدلول الخاص بكل أمر من أوامر البرنامج من خلال التغيرات التي تحدث على حالة جهاز 


الجهاز فإذا تم تسجيل حالة جهاز الحاسوب قبل تنفيذ الأمر ثم يتم تنفيذ الأمر المراد معرفة دلالاته 
وتسجيل حالة الجهاز بعد إتمام التنفيذ فعند ذلك تكون دلالة الأمر واضحة لأنها تتضح في مقدار التغير 
بين الحالة الأولى والثانية بجهاز الحاسوب والتى حدثت نتيجة لتنفيذ الأمر وتكمن المشكلة فى هذه 
الطريقة بالرغم من سهولتها في إمكانية حدوث اختلاف في تأثير ومدلول الأمر حسب مواصفات الجهاز 
التي يتم اختبار مدى التغير الذي يحدث عند تنفيذ الأمر عليه بمعنى أن مدلول الأمر قد يختلف من جهاز 
حاسوب إلى آخر إذا اختلفت مواصفات الجهاز وهذه المشكلة يمكن التغلب عليها إذا تم استبدال جهاز 
الحاسوب الحقيقي بجهاز آخر افتراضي حيث يعتبر هذا الإجراء ليس بغريب ومستحسن في كثير من 
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الأحيان حيث يستخدم في تتبع خطوات البرامج لفهمها أو حتى للتأكد من صحتها ولتوضيح ذلك نقدم 
المثال التالي الذي يقوم بوصف مدلول أمر ۴٥٣‏ في لغة السي باستخدام عدد من الأوامر البسيطة: 
الدلالات التشغيلية للأمر أمر ۴0۴ في لغة السي 
For (expr1 ; expr2 ; expr3 } (‏ 
expr1 ;‏ 
loop: if expr2 = =‏ 


goto out 


expr3 ; 
toto loop 
out 


وعموما فإن أول وأهم استخدام لهذه الطريقة هي وصف دلالات لغة ال 1/ ام وذلك في بداية 
السبعينات من القرن الماضي حيث تم الاستعانة ببعض أوامر لغات البرمجة البسيطة والأقل في 
المستوى والتي ظهرت قبل ذلك لوصف مدلولات كل أمر وكل تركيبة في لغة ال 1 / ۴1 وهذه الطريقة 
بالرغم من سهولتها وبساطة أسلوبها إلا أن ما يعاب عليها هو الاعتمادية لأن وصف دلالات أي لغة 
باستخدام هذه الطريقة يعتمد على أوامر لغة أخرى معروف دلالاتها مسبقا وليس على شكل موحد متفق 
عليه وهو ما لجأت إليه الطريقتان الأخرتان في الاعتماد على المنطق والرموز الرياضية في وصف 
دلالات التراكيب البرمجية المختلفة. 1 


المترجم البسيط ذو المرحلة الواحدة 
A Simple One Pass Compiler‏ 
1. الترجمة نحوية التوجه 


إن القواعد الخالية السياق ) (Context A Free Grammars‏ وشكل باکكوس iور‏ ) Backus‏ 
Fm‏ urهN)‏ اللذان تم عرضهما في الوحدة السابقة بجانب قدرتها على وصف القواعد النحوية 
للغات يمكن أيضا استخدامها للمساعدة في توجيه عملية الترجمة الخاصة ببرامج هذه اللغات حيث تقود 
القواعد النحوية عملية الترجمة وهو الأسلوب الذي يسمى بالترجمة نحوية التوجه ( 8 ×ه†١۷؟‏ 
ationاrrans )0irected‏ والشكل التالي يوضح مراحل هذا الأسلوب من الترجمة: 
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حيث يقوم محلل المفردات (۲عzراة١۸‏ |هءi»×ع1ا)‏ بتحويل سيل الحروف الذي تدخل إليها إلى سيل آخر 
من الكات و رجور الى تمل اترات الخاح الت ا ر ها وه اال كن المفركاة ت 
إدخاله إلى المترجم النحوي التوجه ( atorائم Directed ra‏ 8 xهSynt)‏ الذي یقوم بتحویلھا إلى 
شفرة وسيطة. ومن ذلك يتضح أن المترجم النحوي التوجه قد قام بدمج ثلاثة مراحل من مراحل الترجمة 
في وف الاد( وة اتان الخو ومر اتل ا ر خا ا اة الرس فى 
مرحلة واحدة مجمعة تنتهي إلى الشفرة الوسيطة مباشرة. 


ولتوضيح هذه الطريقة في الترجمة سوف نقوم ببناء مترجم بسيط لترجمة التعبيرات الرياضية 
بشكلها المعتاد الوسطى الشكل ( ۴٠١١‏ ×ا۴م|ا) التي تظهر فيه العمليات الرياضية من جمع وطرح 
وضرب وقسمة في وسط أطراف العملية ( متل التعبير الرياضي 4 + 8-3 ) إلى شكل آخر من 
التعبيرات الرياضية يعرف بالشكل اللاحق ( ۴٠۲۳‏ ×ا۴†ومم) والتي تظهر فيه العمليات الرياضية بعد 
أطرافها في التعبير الرياضي والشكل التالي يعرض نفس التعبير الرياضي السابق ولكن تظهر فيه 
العمليات في شكل لاحق: + 4 84 


والسبب الأساسي للجوء إلى ترجمة لغة هذه التعبيرات البسيطة التي تشمل فقط على أرقام وعمليات 

رياضية هو لجعل مرحلة تحليل المفردات ( كأوراة٣A۸‏ اهءأ»×م1ا) في غاية السهولة لأن كل حرف 
منفصل من سيل الحروف الذي سيتم إدخاله إلى هذه المرحلة يعتبر مفرده (١ع)هآ)‏ في حد ذاته من 
مفردات اللغة وذلك بفرض أن جميع أطراف عمليات التعبير الرياضي عبارة عن أعداد تتكون من رقم 
واحد فقط ولكن لاحقا سوف نقوم بتوسيع هذه اللغة البسيطة لتشمل أعدادا تتكون من آرقام ومتغيرات 
وكذلك كلمات والآن نقوم بوصف التعبير الرياضي البسيط الذي يتكون من الأرقام بالإضافة إلى رمزي 
الجمع والطرح فقط وذلك باستخدام شکل أل ۴ BN‏ : 
<exp> <exp> + <digit>‏ 

<exp> - <digit> | 

<digit> |‏ 
digit> 0| 1| 2|3|4|5|6| 7| 8| 9>‏ 
والقواعد النحوية السابقة توصف التعبير الرياضي بشكله الوسطي المعتاد والذي نريد تحويله باستخدام 
المترجم البسيط إلى تعبير رياضي بالشكل اللاحق والذي يمكن الآن تعريف كيفية التحويل من الشكل 
الأول إلى هذا الشكل الجديد: 


أولاّ: إذا كان التعبير الرياضي عبارة عن رقم أو حتى متغير فإن الشكل اللاحق له هو نفسه دون تغير. 
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ثانيا : إذا كان التعبير الرياضي يتكون من تعبيرين رياضيين بينهما عملية أي على الشکل ۴2 مه ۴٤1‏ 
ءفإن الشكل اللاحق لهذا التعبیر یکون على الشکل م٥2‏ ع 1 ع حیث أن 2 ٤ء‏ 1 ع هما الشكل اللاحق 
لکل من 2غ 1ع على ارال 


الفا : إذا كان التعبير الرياضي داخل أقواس أي على الشكل (ع) فإن الشكل اللاحق له یکون ع » حيث 
أن ۴ هو الشكل اللاحق للتعبير ۴ دون استخدام الأقواس. 


وسبب هذه النقطة الأخيرة هو أن التعبير الرياضي بشكله اللاحق لا يحتاج إلى استخدام الأقواس 


لتحديد أولوية تنفيذ العمليات لأن موضع العملية داخل التعبير الرياضي في هذا الشكل هو فقط الذي 
يحدد ترتيب تنفيذ العمليات ودون تطبيق قاعدة للأولويات أو الحاجة لاستخدام الأقواس وهو ما يميز هذا 


الشكل اللاحق للتعبيرات الرياضية فمثلا الشكل اللاحق للتعبير الرياضي الوسطي 3+(4 - 8 )+ 3 هو 
+3 84 بينما الشكل اللاحق للتعبير (3 + 4)-8 هو -+843 

والآن نحتاج للقيام بهذه الترجمة باستخدام القواعد النحوية الخصائصية (attribute Grammar)‏ 
السابق شرحها في الوحدة السابقة وذلك لإضافة بعض الخصائص إلى القواعد النحوية التي تصف 
التعبير الرياضي المعتاد بشكله الوسطي والتي يتم تحديد القيمة الخاصة بكل منها عن طريق مجموعة 
من القواعد الدلالية يتم إلحاقها بالقواعد النحوية السابقة لتصبح كما يلي: 
Syntax rule: < exp > < exp >[1] + < digit -1‏ < 
Semantic rule: < exp >.post < exp >[1].post || < digit >.post | |‏ '+' 
Syntax rule: < exp > < exp >[1]| - < digit -2‏ < 
Semantic rule: < exp >.post < exp >[1].post || <digit>. post | |‏ '-' 
Syntax rule: < exp > < digit -3‏ < 
Semantic rule: < exp >.post < digit >.post‏ 
Syntax rule: <digit> O -4‏ 
'Semantic rule: < digit >.post 'O‏ 


Syntax rule: <digit> 1 -5 


'Semantic rule: <digit>.post '1 
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Syntax rule: <digit> 9 -13 
'Semantic rule: <digit>. post '9 


حيث يلاحظ أن الخاصية ئم تعبر عن القيمة الخاصة بها عن الشكل اللاحق للتعبير الرياضي 
بعناصره المختلفة وأن القواعد الدلالية التي تقوم بتحديد قيمة هذه الخاصية توصف كيفية ترجمة التعبير 
الرياضي من شكله الوسطي المعتاد إلى الشكل اللاحق هذا وقد تم استخدام الرمز |١‏ في القواعد الدلالية 
للتعبير عن عملية دمج عدة مفردات داخل الجملة أو التعبير الرياضي. مع ملاحظة أن القواعد الدلالية 
من رقم 4 إلى رقم 13 توضح أن الشكل اللاحق للأرقام من رقم 0 إلى رقم 9 هو نفس الرقم دون تغير. 


والشكل التالي يعرض شجرة الإعراب ذات الحواشي ( ٥٥†-ع۲5‏ ۴2 لع†ه†امممA)‏ للتعبير الرياضي 
3 + 8-4 والتي تتضمن الحواشي الخاصة بها الخاصية وهمم والتي تعكس قيمتها كيفية الوصول إلى 
الشكل اللاحق لهذا التعبير الرياضي. 


وعموما لا تقوم القواعد النحوية الخصائصية بتحديد ترتيب محدد لإيجاد القيم الخاصة بالخصائص 
التي تستخدم في قواعدها الدلالية. ففي المثال السابق لم يتم تحديد ترتيب محدد للوصول إلى الشكل 
اللاحق (قيمة الخاصية مم ) لكل عنصر من عناصر التعبير الرياضي فليس هناك فرقا بين البدء من 
رقم 8 أو من رقم 4 أو من رقم 3 ولكن لا بد من إيجاد القيم الخاصة بخصائص جميع العقد المتفرعة 
من عقدة رئيسية قبل إيجاد القيم الخاصة بهذه العقدة الرئيسية فمتلاً في الشكل السابق لابد من تحديد قيمة 
الخاصية وم لكل من الرقم 8 والرقم 4 حتى يمكن الوصول لقيمة هذه الخاصية للتعبير 4 - 8 وهكذا 
حتى نصل إلى قيمة الخاصية الخاصة بالتعبير الرئيسي ولكن على الرغم من عدم تحديد هذا الترتيب 
فانه من المفضل أن يحدد مسبقا الترتيب الذي سيتم به إيجاد القيم الخاصة بالخصائص المستخدمة في 
القواعد الدلالية الملحقة بالقواعد النحوية الخصائصية وهو ما یعکسه ترتیب التنقل ( ا۵٣٥۷‏ ھ٣۲)‏ داخل 
شجرة الإعراب ذات الحواشي حيث يوجد أكثر من ترتيب يمكن التنقل من خلاله داخل أي شجرة بدء 
من جذر الشجرة ( مله اهه۸) ومرورا بجميع الأفرع التي تتضمنها الشجرة ولكن بالنسبة للتنقل 
داخل شجرة الإعراب بصفة خاصة بأن ار المفضل لذلك هو إعطاء أولوية للوصول إلى عمق 
الشجرة وهو الأسلوب الذي یسمی التنقل للعمق أو لا ( ھ١٣۵٥۲۲۵۷‏ ٣۴-طtمم0)‏ حيث يتم التنقل داخل 
الشجرة بدء من الجذر مع زيادة أبناء كل عقدة بشكل متكرر من اليسار إلى اليمين وهو ما يوضحه 
ترتيب الأرقام بالشجرة المبينة في الشكل التالي: 


ووفقا لهذا الأسلوب يكون ترتيب تنفيذ القواعد الدلالية المصاحبة للقواعد النحوية الخصائصية كما 
يوضحه خطوات الإجراء التكراري (عr u‏ dعc٥۴‏ ع۸ecusi۷v)‏ التالي: 


(procedure visit (n: node 
begin 


for each child m of n, from left to right do 
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(visit (m 
evaluate semantic rules at node n 


end 
مخططات الترجمة‎ .. 


مخطط الترجمة ( مصعطء؟ «هiةایمه٣آ)‏ هو أيضا عبارة عن قواعد خالية السياق ولكن مع 
إضافة بعض الخطوات البرمجية التي لها تأثيرات دلالية (ئم A‏ ٣ة"‏ م5) حيث يتم وضع هذه 
الخطوات في الجانب الأيمن من القواعد النحوية وبصفة عامة تتشابه مخططات الترجمة مع القواعد 
الخصائصية في عديد من الأشياء ولكن هناك فرق أساسي بينهما هو أن ترتيب تنفيذ القواعد الدلالية في 
مخططات الترجمة يتم تحدیدها بشکل واضح وذلك حسب موضع التأثير الدلالي داخل القاعدة النحوية 
حيث يتم وضع هذه التأثيرات بين أقواس من النوع ([ ) في الجانب الأيمن للقواعد النحوية وحسب 
مكان كل تأثير داخل القاعدة يتم تحديد ترتيب تنفيذ هذا التأثير بين التأثيرات الدلالية المختلفة والمتال 
التالي عبارة عن أحد القواعد النحوية التي تحتوي على تأثير دلالي: 


[rest> + <term> {print ('+'} <rest> [1> 


AE AN N AS E Oa 
باللغة التي يمثلها هذا المخطط وذلك عن طريق تنفيذ ما يحتوي عليه من تأثيرات دلالية بالترتيب الذي‎ 
ألو الل لمق اخل جر الاغو ات الخاكة هده لجف فلي ميل امكل اد كانت فة‎ 

الأغز ات التالنة نمثل الفا عدة التحرية المناقة 


ففي هذه الحالة فإن التأثير الدلالي [('+/) ٣م‏ يتم تنفيذه بعد الانتهاء من جميع الأفرع المتشعبة 
من الشجرة التي تبدأ عند الرمز اللانهائي < >٣"‏ ولكن قبل البدء في أفرع الشجرة التي تبدأً عند 
الرمز اللانهائي [1<]1ءه۲> وعموما فإنه عند إنشاء شجرة إعراب لأحد مخططات الترجمة فإنه يتم 
تمثيل كل تأثير دلالي يحتوي عليه من خلال فرع إضافي يتم توصيله بخط متقطع مع الرمز اللانهائي 
الذي يقع في الجانب الأيسر من القاعدة النحوية التي تحتوي على هذا التأثير الدلای 6 وهو ما يظهر ت 
شجرة الإعراب السابقة مع ملاحظة أن العقدة الخاصة بالتأثير الدلالي تكون عقدة منتهية مثلها في ذلك 
مثل العقد التي تمثل رموز نهائية في اللغة مثل رمز الجمع (+) في شجرة الإعراب السابقة. 


والآن نعود إلى عملية ترجمة التعبيرات الرياضية من شكلها الوسطي المعتاد إلى الشكل اللاحق لها. 
ولكي يمكن استخدام مخططات الترجمة في القيام بهذه المهمة فإنه لا بد أن تكون القواعد النحوية 
الخصائصية التي تصف هذه العملية قواعد خصائصية بيط ) (Simple Attribute Grammar‏ 
ولكي تكون كذلك فلا بد أن تكون الترجمة الخاصة بكل رمز لا نهائي يظهر في الجانب الأيسر من كل 
قاعدة نحوية ينتج عن دمج الترجمات الخاصة بالرموز اللانهائية التي تظهر في الجانب الأيمن من تلك 
القاعدة النحوية وبنفس ترتيب ورودها في هذه القاعدة مع إمكانية إضافة آي رموز نهائية بين هذه 
الترجمات التي يتم دمجها فإذا كانت القواعد الخصائصية تتوفر فيها هذه الصفة قإنه يمكن اللجوء إلى 
مخططات الترجمة للقيام بعملية الترجمة المطلوبة وإن لم تكن فإنه لا يمكن اللجوء إلى مخططات 
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الترجمة للقيام بذلك ولتوضيح هذه الصفة نقوم باستعراض أحد القواعد الخصائصية الخاصة بالتعبير 
الرياضي والتي سبق عرضها في بداية هذا الجزء: 
<Syntax rule : <exp> <exp>[1] + <digit‏ 
Semantic rule: <exp>.post <exp>[1].post | | <digit>.post‏ || '+' 

حيث نلاحظ أن ترتيب عملية ترجمة الرمز اللانهائي <م×م> الذي يظهر في الجانب الأيسر للقاعدة 
النحوية السابقة هو ناتج عملية دمج لترجمات الرموز اللانهائية التي تظهر في الجانب الأيمن من هذه 
القاعدة وبنفس ترتيب ورودها. وهذا ما توضحه القاعدة الدلالية المصاحبة لهذه القاعدة مع إضافة الرمز 
النهائي '+' في نهاية هذه الترجمات وبالتالي يتضح أن القاعدة الخصائصية السابقة هي قاعدة خصائصية 
بسيطة ويمكن إعداد مخطط ترجمة مقابل لها يكون كما يلي : 
exp> <exp> [1] + <term> { print>‏ )'+({ 


حيث تم إضافة تأثير دلالي إلى القاعدة النحوية السابقة. 


وبنفس الطريقة يمكن التأكد من أن جميع القواعد النحوية الخصائصية التي توصف عملية ترجمة 


۰ 


ترجمة التعبيرات الرياضية من شكلها الوسطي المعتاد إلى الشكل اللاحق لها وتصبح مخططات 
الترجمة الخاصة بذلك كما يلي: 


{ (+') exp> <exp> + <digit> {print> 
{ (-') exp> <exp> - <digit> {print> 


<exp> <digit> 


{ (digit> O { print ('O> 
{ (digit> 1 { print ("1> 
{ (digit> 9 { print ("9> 
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وبذلك تكون شجرة الإعراب التي تمتل التعبير الرياضي 3 + 4 -8 والتي تحتوي على تأثيرات دلالية 
كما يلي: 


حيث يمكن الحصول على الترجمة الخاصة بهذا التعبير الرياضي والتي تمتثل الشكل اللاحق له من 
خلال التنقل داخل شجرة الإعراب السابقة بأسلوب التنقل للعمق أولا مع تنفيذ التأثيرات الدلالية وفقا 
للترتيب الخاص بهذا الأسلوب لتكون نتيجة الترجمة التعبير الرياضي +3 84 والذي يمثل الشكل 
اللاحق لهذا التعبير الرياضي. 


وبمقارنة شجرة الإعراب في حالة استخدام مخططات الترجمة بشجرة الإغراب في حالة استخدام 
القواعد النحوية الخصائصية نجد أن عملية الترجمة تتم في الحالة الأولى من خلال تنفيذ التأثيرات 
الدلالية والتي تقوم بطباعة مخرجات عملية الترجمة وفقا للترتيب المحدد لذلك بينما في الحالة الثانية 
تكرن .خر جات اة الئر مةه ملحقة بجر رة الاغر اب ول يمك الول ها ال ب اها هن 
إنشاء شجرة الإعراب بالكامل وإيجاد قيمة الخصائص الملحقة بها بشكل تتابعي من أسفل إلى أعلى 
لحين الوصول إلى الخاصية الخاصة بجذر الشجرة والتي تمثل نتيجة عملية الترجمة ولكن لكون ترتيب 
اا ر ا عر ل و اة طت ار ج هى فن فو ت ف ارات 
اة الملحقة بجر الاغر ات في هذه الحالة فاته تسكن تة ذه التائير ات اتا انشا شجرة 
الاع راب درن نتر الاتهاء من ناء رة الاغر أت تالكامل و هدا ما تمر بطر يقد مخططات الثر ية 
عن القر اعد النحوية الخصضائضية ولكن كما أشرنا لذلك من قبل فانة حت بمكن استبذال ألقرأعد النحوبة 
الخصائصية بمخططات الترجمة لا بد أن تكون تلك القواعد قواعد بسيطة. 
. الإإعراب Parsing‏ 


إن الإعراب كما أشرنا إلى ذلك من قبل هو العملية الخاصة بتحديد ما إذا كانت الجملة التي تتكون 
من بعض مفردات أحد اللغات يمكن توليدها أو اشتقاقها من القواعد النحوية الخاصة بهذه اللغة وفي هذا 
الصدد لا بد أن نلفت الانتباه إلى أن شجرة الإعراب التي تساعد في هذه العملية لا يقوم المترجم الخاص 
باللغة بإنشائها بشكل فعلي ولكن يتم محاكاة التنقل داخل هذه الشجرة دون الحاجة إلى إعدادها مسبقاً 
وهذا ما سوف يتضح في الجزء ال ت م ركن رمح كام مكلو ا الي قو ا 
مخططات الترجمة المشار إليها في الجزء السابق بينما في هذا الجزء سوف نقوم بتقديم أحد طرق 
الإعراب التي يمكن تطبيقها عند بناء المترجمات نحوية التوجه. 


أغلب الطرق الخاصة بالإعراب يمكن تصنيفها إلى مجموعتين طرق إعراب من أعلى إلى أسفل 
Parsing)‏ down-p٥rآ)‏ وطرق إعراب من اسفل إلی أعلی (gعہائrھ٣‏ مpں۔- )Bu tt٥‏ . ویرجع ھذا 
التصنيف إلى ترتيب إنشاء عقد شجرة الإعراب. ففي المجموعة الأولى من طرق الأعراب يتم إنشاء 
هذه العقد بدء من جذر الشجرة وتستمر حتى الوصول إلى الأوراق بينما في المجموعة الثانية يتم إنشاء 
عقد الشجرة بالعكس بدءَ من أوراق الشجرة وتستمر في الصعود حتى الوصول إلى جذر الشجرة. 
وبصفة عامة فإن طرق الإعراب من أعلى إلى أسفل تعتبر هي الطرق الأكثر شيوعا حيث يرجع ذلك 
إلى سهولة إنشاء شجرة الإعراب بالترتيب الطبيعي من أعلى إلى أسفل ومع ذلك فإن طرق الإعراب 
من أسفل إلى أعلى بالرغم من ذلك تستخدم في عدد ليس بالقليل من الأدوات البرمجية المساعدة التي 
تقوم بإنشاء المترجم أوتوماتيكيا من مخططات الترجمة وذلك لقدرتها على التعامل مع أغلب أنواع 
القواعد النحوية ومخططات الترجمة الخاصة بلغات البرمجة المختلفة. 
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1.. الإعراب من أعلى إلى أسفل 


في البداية سوف نقدم هذه الطريقة من خلال استخدام أحد القواعد النحوية المناسبة لهذا الأسلوب من 
الإعراب على أن نقوم فيما بعد في نهاية هذا الجزء بإعداد وحدة إعراب ( ۲٥ء٣‏ هم) عامة تستطيع 
تطبيق هذه الطريقة على جميع أشكال القواعد النحوية فالقاعدة النحوية التالية تقوم بوصف بعض أنواع 
البيانات في لغة الباسكJi‏ ) Language (Pascal‏ : 


<type> <simple> 

<array [ <simple> ] of <type | 
simple> integer> 

char | 


num dotdot num | 


مع ملاحظة أن الرمز النهائي ۳نم يعنى أي رقم صحيح وتم اعتباره رمز نهائيا لتبسيط القاعدة 
النحوية الموضحة في المثال بينما الرمز النهائي هلامك فهو بديل للرمز '. .' لتوضيح ضرورة 
ورودهما كوحدة واحدة ولإنشاء شجرة الإعراب من أعلى إلى أسفل يتم البدء من جذر الشجرة المعنون 
برمز البداية اللانهائي مع الاستمرار في تطبيق الخطوة التالية: 


عند كل موضع في الشجرة معنون بأحد الرموز اللانهائية يتم اختيار أحد القواعد النحوية التي يظهر هذا 
الرمز على الجانب الأيسر لها حيث يتم تكوين العقد المتفرعة من هذا الموضع والمعنونة بالرموز 
النهائية واللانهائية التي تظهر على الجانب الأيمن لهذه القاعدة التي تم اختيارها وهكذا إلى أن نصل إلى 
أوراق الشجرة المعنونة كلها برموز نهائية فقط. 


والشكل التالي يوضح كيفية تطبيق الخطوة السابقة من البداية وحتى استكمال شجرة الإعراب الخاصة 
EE‏ 


وتطبيق الأسلوب السابق لإنشاء شجرة الإعراب من أعلى إلى أسفل يمكن تنفيذه لعدد من القواعد 
النحوية أثناء مسح مجموعة الحروف المدخلة من اليسار إلى اليمين (في حالة اللغات الأجنبية) لمرة 
واحدة فقط وغالبا ما يطلق على مؤشر المفردة الحالية التي يتم مسحها اسم المؤشر المتقدم 
(0kahe20ها)‏ وفي بداية إنشاء شجرة الإعراب يكون موضع هذا المؤشر عند أول مفردة في جملة 
الإدخال من أقصى اليسار. 
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بالنسبة لمثال جملة الإدخال السابقة فإن المؤشر المتقدم يبدأ من عند كلمة 'ره٣ه'‏ بينما يتم البدء في 
أنشاء تجرة الإعرات المقالة من خذر الشجرة المخرن برمز البذاية اللاتهات <ةم > رالشكل الذالى 
وط مورط لمر تو الم غك عضن راح انشا تخرة الإعراي الخاص تائمل لاف 


ونهدف إلى استكمال شجرة الإعراب بالطريقة التي يحدث فيها تطابق بينها وبين مفردات جملة 
المدخلات ولكي يحدث هذا التطابق تم في البداية إنشاء تفريعات من موضع جذر الشجرة تبدا بالرمز 
النهائي ره٣ه‏ المقابل للمفردة التي يقف عندها مؤشر جملة الإدخال حيث توجد قاعدة واحدة من القواعد 
النحوية بالمثال التي يظهر فيها الرمز رهه في بداية الجانب الأيمن من القاعدة بينما يظهر الرمز 
اللانهائي < مم ر†> في الجانب الأيسر لها. وبالتالي يتم اختيار هذه القاعدة لإنشاء تفريعات شجرة 
الإعراب وهكذا يستمر إنشاء شجرة الإعراب. وفي كل مرة يكون فيها موضع الشجرة عند رمز نهائي 
يتطابق مع المفردة التي يشير لها مؤشر جملة المدخلات يتم تقديم هذا المؤشر إلى المفردة التالية بجملة 
الإدخال مع الانتقال إلى العقدة التالية في شجرة الإعراب. أما في حالة ما يكون موضع الشجرة عند 
رمز لانهائي» يتم اختيار القاعدة النحوية التي تحافظ على التطابق مع المفردة التي يشير لها مؤشر جملة 
الإدخال وهكذا إلى أن ينتهي إنشاء شجرة الإعراب التي تتطابق مع مفردات جملة المدخلات. 


وبصفة عامة فإن عملية اختيار القاعدة النحوية المناسبة للرمز اللانهائي التي تحافظ على التطابق مع 
جملة المدخلات تحتمل التجربة والخطاً في بعض الأحيان وقد تتطلب العودة في الاختيار والبحث عن 
قاعدة نحوية أخرى إذا اتضح أن القاعدة التي تم اختيارها في المرة الأولي غير مناسبة ولكن هناك 
طريقة خاصة ومهمة للإعراب تسمى الإعراب التنبؤي ( ع١‏ كج۴ ع۷أأكم٥)‏ لا يحدث فيها هذه 
المشكلة ولا نحتاج في هذه الطريقة التراجع في اختيار القاعدة النحوية لأن الاختبار يكون سليما بصفة 
دائمة من المرة الأولى. 


2. الإعراب التنبؤي 


هناك طريقة من طرق الإعراب من أعلى إلى أسفل تدعى الإعراب التنازلي التكراري 
)Recursive-Descent Parsing)‏ يتم فيها تحليل الصيغ النحوية الخاصة باللغة وإعداد مجموعة من 
الإجراءات التكرارية (sعإduععها۴‏ مvاsاecuعNR)‏ ليتم تنفيذها وفقا لمفردات جملة المدخلات حيث يتم 
ربط كل إجراء من هذه الإجراءات بأحد الرموز اللانهائية التي تحتوي عليها القواعد النحوية للغة 
ويعتبر الإعراب التنبؤي أحد حالات هذه الطريقة حيث يتم اختيار الإجراء المصاحب لكل رمز لا نهائي 
دون أي غموض وفقا للمفردة التي يشير لها مؤشر جملة المدخلات وبذلك يكون ترتيب تنفيذ هذه 
الإجراءات الخاصة بالتعامل مع جملة المدخلات تحاكي إنشاء شجرة الإعراب المقابلة لهذه الجملة ولكن 
دون أن يتم إنشاءها بشكل فعلي. 


وفيما يلي نعرض مجموعة من الإجراءات تمثل عملية الإعراب التنبؤي وفقا للقواعد النحوية المستخدمة 
في المثال السابق: 


(procedure match (t:token * 


begin 
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if lookahead = t then 

lookahead : = nexttoken 

else error 

end 

procedure type * 

begin 

if lookahead in {integer', ' char '. 'num'} then 
simple 

else if lookahead = 'array' then begin 
,match ('array'); match ('['); simple 
match ( ']'); match ('of'); type 

end 

else error 

end 

procedure simple * 

begin 

if lookahead = 'integer' then 

("match ("integer 

else if lookahead = 'char' then 
("match ('char 


else if lookahead = 'num' then 


Compiler for msc of cs 
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;('match ('num'); match ('dotdot'); match('num 
else error 


end 

حي تختوئ وة الإعراب التبري:السابفة على ثلائة إجراءات: الإأجرآء الأرلخاض بيذ عمية 
التطابق مع مفردات جملة المدخلات بينما الإجراءين الثاني والثالث فهما يقابلان الرمزين اللانهائيين 
<عممرا> و <عامصاء> الموجودين بالقواعد النحوية السابقة وتبدأ عملية الإعراب باستدعاء الإجراء 
الخاص برمز البداية اللانهائي <همرا> مع نفس جملة المدخلات السابق استخدامها في المثال والتي 
يبدا عندها المؤشر عند المفردة الأولى 'ره٣٣ه'‏ بهذه الجملة حيث يتحقق الأمر الشرطي الثاني في 
الإجراء مما ليتم تنفيذ الخطوات التالية: 


,match ('array'); match ('["'); simple 


match ( ']'); match ('of'); type 
: والتي تقابل الجانب الأيمن من القاعدة النحوية التالية‎ 
<type> array [ <simple> |] of <type> 


حیث يلاحظ أن كل رمز نهائي موجود بالجانب الأيمن للقاعدة السابقة يتطابق مع موضع مؤشر جملة 
المدخلات أما بالنسبة للرموز اللانهائية فإنه يتم استدعاء الإجراء الخاص بكل منها وعند استدعاء 
الإجراء الخاص بالرمز اللانهائي <ء امم أوء> يتحقق الأمر الشرطي الثالث ليتم تنفيذ الخطوات التالية: 
;,('match ('num'); match ('dotdot'); match('num‏ 

والتي تقابل الجانب الأيمن من القاعدة النحوية التالية : 

simple> num dotdot num> 

حيث يقود مؤشر جملة المدخلات عملية الاختيار وهذا ما يحدث بسهولة عندما بيدأ الجانب الأيمن 
للقاعدة النحوية برمز نهائي أي بأحد مفردات اللغة لأنه في هذه الحالة يحدث التطابق مباشرة مع موضع 
مؤشر جملة المدخلات إما في حالة بدء الجانب الأيمن للقاعدة النحوية برمز لا نهائي وهو ما يحدث عند 
تحقيق القاعدة التالية: 

<type> <simple> 
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وهي القاعدة التي يتم استخدامها عندما يكون موضع مؤشر جملة المدخلات يقف عند المفردة "هع عام" 
وعندها يتم استدعاء الإجراء ممرع ولعدم وجود قاعدة نحوية يظهر فيها الرمز اللانهائي <عمر> في 
الجانب الأيسر من القاعدة والرمز النهائي '٣ءعع'‏ في بداية الجانب الأيمن منها لذلك فإن القاعدة 
السابقة تستخدم في هذه الحالة وهو الذي يتم بالفعل حيث يقوم الإجراء همر باستدعاء الإجراء 
مامصiء‏ عندما يكون موضع مؤشر جملة المدخلات يقف عند المفردة "ععع |' . وفي هذه الحالة فإن 
طريقة الإعراب التنبؤي تعتمد على معلومات تساعدها في القيام بذلك من خلال معرفة جميع الرموز 
النهائية التي يمكن أن تبدأ بها جمیع مات ارز اللانهائي الذي يظهر في بداية القاعدة اة خت 
تم تحديد أن الرموز النهائية ' امعم" و "٣ط"‏ و 'ںمص' يمكن أن تشتق من الرمز اللانهائي 
<مامصاء> ولكي نكون أكثر تحديدا فإذا فرض أن الرمز اللانهائي الذي يظهر في بداية الجانب الأيمن 
من القاعدة النحوية هو الرمز » فإن ( » ۴|85١)‏ هي المجموعة الأولي للرمز » التي تشتمل على 
جميع الرموز النهائية التي تبداً بها جميع الجمل التي يمكن اشتقاقها من الرمز اللانهائي ى بمعنى أن 


{FIRST (<simple>) = {integer, char, num 


{FIRST (array [<simple>] of <type>) = {array 


مع ملاحظة أنه يمكن اشتقاق الجملة الفارغة والتي يرمز لها بالرمز € من بعض الرموز اللانهائية 
وبالتالي فان ( ۴|۸51 ( » قد تشتمل على هذا الرمز وعموما فإننا سندرس المجموعة الأولي وطريقة 
حسابها في الوحدة الخامسة ولكننا نشير هنا إلى حالة وجود أكثر من قاعدة نحوية تشترك في الرمز 
اللانهائي الذي يظهر في الجانب الأيسر لهما كما في حالة القاعدتين التاليتين : 


A> a> 
A> 8> 


ففي هذه الحالة ولكي ينجح الإعراب التنبؤي فإنه لا بد من عدم حدوث تقاطع بين محتويات ( » 
)۴۱۴5۲۰ » ومحتويات ( 8 ۴1۴85۲١)‏ لأن حدوث ذلك يؤدي إلى عدم التأكد عند اختيار أي من القاعدتين 
التي يتم تطبيقها في حالة ما إذا كان موضع موؤشر جملة المدخلات يقف عند المفردة المشتركة بين 
الاثنين ولذلك فإن الإعراب التنبؤي لا يمكن استخدامه مع القواعد النحوية التي تحدث فيها مثل هذه 
الا 

. مشكلة التكرار من ناحية اليسار 


إن وجود تكرار من ناحية اليسار ( ٣oایاuءمR‏ اfعا)‏ في القواعد النحوية الخاصة باللغة من 
الممكن أن يسبب مشكلة لطريقة الإعراب التنازلي التكراري (بما فيها أسلوب الإعراب التنبؤي) وهذه 
المشكلة تتعلق بامكانية حدوث تكرار غير منتهى عند تنفيذ الإجراءات الخاصة بوحدة الإعراب 


ولتوضيح ذلك نفترض القاعدة النحوية التالية : 
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<exp> <exp> + <term> 


ففي هذه القاعدة نجد أن الرمز اللانهائي < م×ه> والذي يظهر في أقصى يسار الجانب الأيمن من 
القاعدة النحوية هو نفس الرمز اللانهائي الذي يظهر في الجانب الأيسر لها وبفرض أن الإجراء م×ع 
المقترن بهذا الرمز اللانهائي قرر استخدام هذه القاعدة النحوية لكون الجانب الأيمن لها يبدأ بنفس الرمز 
فإنه سيقوم باستدعاء نفسه مرة أخرى وهو ما يؤدي إلى حدوث التكرار إلى ما لا نهاية وذلك لأن مؤشر 
جملة المدخلات لا يتغير موضعه للأمام إلا في حالة تطابق موضع المؤشر مع الرمز النهائي الموجود 
بالقاعدة النحوية ولكن القاعدة السابقة تبدأ برمز لا نهائي وبالتالي لن يحدث أي تقدم في مؤشر جملة 
المدخلات مما يجعل التكرار غير منتهى. 


کک کا ا ع ا تن على كران من اة ا 
ليصبح التكرار من الناحية اليمين ( ٣٠اواuءمR‏ ع8İ)‏ وذلك لأن هذا النوع الأخير من التكرار لا 
يسبب مشكلة لطريقة الإعراب التنازلي التكراري ولكنه قد يصعب من عملية ترجمة جمل المدخلات 
التي تحتوي على عمليات يسارية الإتحاد ( Operators‏ associative-۴tها)‏ وهو ما سنعرضه في 
الأجزاء التالية ونوضح الآن كيفية تحويل القواعد النحوية التي تتضمن على تكرار من ناحية اليسار إلى 
قواعد نحوية ذات تكرار من ناحية اليمين وبفرض أن الرمز اللانهائي <4> يتم وصفه من خلال 
القاعدة التالية: 


| A> <A> a B> 

حيث أن كلا من ى و 8 عبارة عن سلسلة من الرموز النهائية واللانهائية دون أن يبدأ أي منهما بالرمز 
اللانهائي <4> والقاعدة النحوية الأولى في هذه الحالة هي قاعدة ذات تكرار من ناحية اليسار ويمكن 
إعادة كتابة القاعدتين السابقتين ليصبحا كما يلي : 

<A> 8B <R> 

R> a <R> | €> 

فهذه القواعد النحوية الأخيرة تكافئ القاعدتين السابقتين لكونهم يحققوا نفس النتيجة ولكن مع استبدال 
التكرار من ناحية اليسار إلى تكرار من ناحية اليمين والذي يظهر في القاعدة الثانية من المجموعة 
الأخيرة حيث يظهر الرمز اللانهائي <8> والذي تم إضافته إلى هذه المجموعة في الجانب الأيسر لتلك 
القاعدة وأيضا في أقصى يمين الجانب الأيمن لها وهو ما يمثل تكرار من ناحية اليمين ونطبق الآن ذلك 
على المثال التالي الذي يشمل على قاعدتين نحويتين ذات تكرار من ناحية اليسار : 

<exp> <exp> + <term> 


<term> | 
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ففي هذا المثال نجد ما يلي : 
<A> = <exp>‏ 

<a =+ <term 

<6 = <term 


و بالتالي يمكن استبدال القاعدتين السابقتين إلى مجموعة القواعد النحوية التالية ذات التكرار من ناحية 
اليمين: 


<exp> <term> <restz> 

<rest> + <term> <rest> 

€ | 

مع إمكانية إعادة كتابة القاعدة النحوية الثانية من أجل التبسيط لتصبح كما يلي : 


rest> + <exp> | €> 


الآن وبعد دراسة الترجمة نحوية التوجه وطرق الإعراب من أعلى إلى أسفل وخاصة طريقة 
الإعراب التنازلي التكراري التي تتضمن أسلوب الإعراب التنبؤي فإنه يمكننا إنشاء مترجم نحوي 
التوجه والذي يقوم بترجمة التعبيرات الرياضية بشكلها الوسطي المعتاد إلى الشكل اللاحق لها حيث 
سيتكون هذا المترجم من برنامج كامل مكتوب بلغة ع وكما ذكرنا في السابق فإننا سوف نكتفي في هذه 
المرحلة بالتعبيرات الرياضية التي تتكون من مجموعة من الأرقام التي يفصل بينها رمزي الجمع 
والطرح فقط على أن يتم تعقيد هذه التعبيرات في الأجزاء التالية من هذه الوحدة لتتضمن الإعداد 
والمتغيرات والعمليات الأخرى. وعموما تساعد مخططات الترجمة نحوية التوجه فى تحديد مواصفات 
المترجم وسوف نستخدم المخططات التالية والسابق عرضها من قبل كتعريف للمترجم الذي نحن بصدد 
اعداده : 


{(+') exp> <exp> + <term> {print> 
{(-'Jexp> <exp> - <term> { print> 
<exp> <term> 


{(term> O {print ('O> 
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{(term> 1 {print ("1> 


{(term> 9 {print ("9> 


وكما يحدث في أغلب الحالات من ضرورة إدخال بعض التعديلات على القواعد النحوية حتى يمكن 
إعرابها بواسطة الإعراب ألتنبؤي فانه بالنسبة للقواعد النحوية السابقة تحديدا لا بد من الاستعاضة عن 
التكرار من ناحية اليسار والذي لا يستطيع الإعراب ألتنبؤي التعامل معه ولكن لا بد أن يتم ذلك بحرص 
شديد ولتوضيح ذلك فإن القواعد النحوية السابقة ستصبح كما يلي بعد استبعاد التكرار من ناحية اليسار 
وباستخدام نفس الطريقة المشار إليها من قبل: 


<exp> <term> <rest> 
rest> + <exp> | - <exp> | €> 
term> 0| 1|... | 9> 

وعلى الرغم من أن هذه القواعد السابقة بعد حذف التكرار من ناحية اليسار منها تقوم بتوليد نفس 
اللغة التي يمكن توليدها من هذه القواعد النحوية قبل حذف هذا التكرار إلا أن هذه القواعد النحوية في 
وضعها الأخير تعتبر غير مناسبة لترجمة التعبيرات الرياضية إلى الشكل اللاحق لها حيث تكمن مشكلة 
هذه القواعد النحوية في أن القاعدة الثانية منها لا تقوم بتحديد طرفي كل من عملية الجمع أو عملية 
الطرح وبالتالي فإن إضافة التأثيرات الدلالية إلى مثل هذه القواعد يكون من الصعب القيام به بالشكل 
السليم الذي يعكس عملية الترجمة ولهذا فإن طريقة حذف التكرار من ناحية اليسار لا بد من استكمالها 


حتى يمكن تطبيقها في حالة احتواء القواعد النحوية على بعض التأثيرات الدلالية فإذا كانت القاعدة 
النحوية التي تحتوي على تكرار من ناحية اليسار على الشكل: 


A> <A> a | <A> 8 | y> 
: فإنها ستصبح على الشكل التالي بعد حذف التكرار من ناحية اليسار‎ 


<A> y <R> 


R> a<R> | 6 <R> | €> 


وفي حالة تطبيق هذه الطريقة بعد تعميمها على القواعد النحوية الخاصة بترجمة التعبيرات الرياضية 
والتي تحتوي على بعض التأثيرات الدلالية فإن المقابل لكل من » و 8 و ۷ سيكون كما يلي: 
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<A> = <exp> 

+") a =+ <term> {print 
{(-") 6 =-<term> {print 
<y = <term 


واا ا طط وخ انا ا دف الك ر ماحد الكيار كا 
ي فان بق سيصبح ر من ناحيه اليسار كما يلي 


<exp> <term> <rest> 

<rest> + <term> {print ("+')} <rest> 
<term> {print ('-')} <rest> - | 

€ | 

{(‘term> O {print ('O> 


{(term> 1 {print ("1> 


{(term> 9 {print ("9> 


وهذا المخطط الأخير للترجمة يجعل من الممكن استخدام طريقة الإعراب التنازلي التكراري حيث 
نقوم الآن بإعداد المترجم بلغة السي الذي يعتمد على هذا المخطط السابق حيث تتضمن شفرة البرنامج 
التالي الوظائف المقترنة بكل من <م×ع> و <اءمم> و >]6٣"<‏ وهي الرموز اللانهائية الموجودة 
في تلك المخطط : ت 


exp 


} 


;, term ; rest 


{ 


rest 
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} (+' = = if (lookahead 
;match ( '+' ); term 

, putchar ('+') ; rest 

{ 

} ('-' = =else if (lookahead 
, match ('-' ) ; term 


, putchar ('-' ) ; rest 


term 


} ( (if ( isdigit (lookahead 
;(putchar ( lookahead 


;(match (lookahead 


{ 


; else error 


{ 
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وبالنسبة للوظيفة ءام التي تقوم بالتأكد من تطابق المفردة التي نقوم باختبارها مع مؤشر جملة 
المدخلات ولأن اللغة التي نحن بصدها جميع مفرداتها تتكون من حرف واحد» لذلك فإن مهمة هذه 
الوظيفة هي مقارنة وقراءة الحروف فقط. 

وقبل تقديم البرنامج الكامل المكتوب بلغة السي والذي يقوم بترجمة التعبيرات الرياضية البسيطة إلى 
الشكل اللاحق لها سوف ندخل بعض التحسينات على الوظائف الثلانة السابقة من هذا البرنامج وخاصة 
الوظيفة ومع حيث سيعاد كتابتها لتصبح كما يلي وذلك لتحويلها من وظيفة تكرارية ( عvأوءاuںعمR‏ 


)۴unction‏ إلى وظيفة غير تكرارية (۸٥i0اء”ں۴‏ ع۷ا†ه٣ه]|)‏ تحتوي على تكرار داخلي لتكون أسرع 


rest 

1 

(while (1 

} (+' ==if (lookahead 
, match ('+') ; term 

; ('*' ) putchar 

{ 

} (-' = = else if (lookahead 
, match ('-' ) ; term 

; ('-' ) putchar 

{ 


; else break 


{ 


والآن نقدم البرنامج الكامل الذي يقوم بعملية ترجمة التعبيرات الرياضية البسيطة التي تتكون من 
مجموعة من الأرقام يفصل بينها رمزي عملية الجمع وعملية الطرح فقط وذلك من شكلها المعتاد إلى 


42 


جامعة النيلين - كلية العلوم/ مدرسة العلوم الرياضية- إعداد / عمر إبراهيم عبدالله Compiler for msc of cs‏ 
الشكل اللاحق لها وهذا البرنامج مكتوب بلغة السي ويتضمن الوظائف الثلاثة السابقة بالإضافة إلى 
الوظيفة الرئيسية "اهم والتي يتم استدعائها في بداية تشغيل البرنامج وكذلك كل من الوظيفة عة 
السابق الإشارة إليها والوظيفة ۲م٣٠‏ التي تقوم بطباعة رسالة الخطاً عند حدوث ذلك: 

<include <ctype.h # 

;int lookahead 

main 

} 

; lookahead = getchar 

, exp 


; (putchar ( '\n 


exp 


rest 


( while (1 

} (' +' = = if (lookahead 

;:(+') match ('+'); term ; putchar 
{ 


} (-' = = else if (lookahead 
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; (-' ) match ('-') ; term ; putchar 


{ 


; else break 


term 


} ((if ( isdigit (lookahead 
; (putchar(lookahead 


; (match (lookahead 


{ 


; else error 


{ 


(match (int t 


} 


(if (lookahead == t 


; lookahead = getchar 


; else error 


error 


; (" printf (" syntax error \ n 
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; (exit (1 


{ 
Lexical Analysis تحليل المفردات‎ . 


في هذا الجزء سوف نضيف إلى المترجم الذي تم تقديمه في الجزء السابق الوحدة المسئولة عن 
تحليل المفردات وهي الوحدة التي تقوم بتحويل جملة المدخلات التي تتكون من مجموعة من الحروف 
إلى مجموعة من مفردات اللغة التي تنتمي لها هذه الجملة وبالتالي فإن مخرجات هذه الوحدة هى هي 
مدخلات وحدة الإعراب (٣٥ءإه۴)‏ وتكمن أهمية محلل المفردات ( ۲عzراه"۸‏ اهء|»×ه1) في تبسيط 
القواعد النحوية التي تعتمد عليها وحدة الإعراب للقيام بالمهمة الخاصة بها والذي يتضح في کون 
الرموز النهائية في هذه القواعد عبارة عن مفردات ( ئ٠ع‌)هآ)‏ وعدم وجود مثل هذه الوحدة داخل 
كان تعاملنا في الجزء السابق مع التعبيراث الرياضية التي تتكون فقط من مجموعة من الأرقام ورمزي 
الجمع والطرح والتي د يعنى أن جميع مفرداتها تتكون من حرف واحد فقط ولكي نتمكن من ترجمة 
التعبيرات الرياضية الى دل علی اعداد ومتغیرات فان الأمر یستلزم وجول الوحدة الخاصة بتحليل 
المفردات ضمن هذا المترجم وسنبدأً هذا الجزء بمجموعة من الوظائف التي لا بد أن يتضمنها محلل 
المفردات. 


1.4. حذف المسافات البيضاء والتعليقات 


في بداية تحليل المفردات لا بد من استبعاد جميع الحروف التي لن يتم تزجمتها من جملة المدخلات 
وذلك للتركيز فقط على باقي الحروف التي تمثل أجزاء مفردات اللغة ومن أهم الحروف التي يتم 
استبعادها المسافات البيضاء (كعءهم؟ عأ ۷) وهي جميع الحروف التي تشغل حيز فارغ داخل جملة 
المدخلات وتتضمن هذه الحروف المسافات الفردية ) (Blanks‏ والمسافة المتعددة ( واجآ) وكذلك 
الحروف الخاصة بالانتقال إلى سطر جديد ( ئها سع") حيث يقوم محلل المفردات بحذف جميع 
المسافات البيضاء من جملة المدخلات التي سیتم ترجمتها وكذلك التعليقات ) (Comments‏ التي يتم 
اها لجل ارامح فى الو من لفات ابرم رذلك كرا لا ب رجاو ةا ب اماي مل 
المسافات اليبضناء 


4 القيم الثابتة 


إن أطراف العمليات في أي تعبير رياضي يمكن أن تكون قيم ثابتة ( وخ" ة†ومه٤)‏ والتي تمثل 
الأعداد الصحيحة أو الكسرية وبالنسبة للأعداد الصحيحة فإن كل عدد يتكون من مجموعة من الأرقام 
ومن الممكن السماح لمثل هذه القيم الثابتة الصحيحة أن تتواجد داخل التعبيرات الرياضية عن طريق 
إضافة بعض القواعد إلى القواعد النحوية التى تصف هذه التعبيرات أو بإنشاء مفردة خاصة تمتل هذه 
اللاك الصجحة قاحلال عة لتكو بة الخ اة بالبرات الو اة و الاش خر هو اقروت 
للاستخدام في أغلب المترجمات حيث يقوم محلل المفردات بتحويل مجموعة الأرقام التي تكون القيمة 
الثابتة الصحيحة إلى وحدة واحدة تمتل المفردة الخاصة بمتل هذه الثوابت الصحيحة فاذا افترضنا أن 
الرمز النهائي رم هو تلك المفردة التي تمتل الأعداد الصحيحة فعندما تظهر سلسلة من الأرقام 
المتتابعة داخل جملة المدخلات فإن محلل المفردات يقوم باستبدالها بالمفردة نم لتصل إلى وحدة 
الإعراب في هذه الصورة الأخيرة مع ملاحظة أن القيمة الأصلية لهذه المفردة والخاصة بقيمة العدد 
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الصحيح فإنه لا بد من تمريرها أيضاً لوحدة الإعراب حيث تعتبر هذه القيمة هي إحدى خصائص هذه 
المفردة التي تسمی num‏ . 


4. تمييز المتغيرات والكلمات المفتاحية 


إن كل لغات البرمجة تسمح باستخدام المتغيرات ) (Variables‏ في البرامج ج المكتوبة بهذه اللغات 
حیث يتم إعطاء (Identifier ) pl‏ لکل متغیر لکي یتم استخدامه داخل هذه البرامج والقواعد النحوية 
للغات البرمجة غالبا ما تقوم بمعالجة هذه المتغيرات وأسمائها كأحد مفردات تلك اللغات ووحدة الإعراب 
وفقا لهذه القواعد تحتاج أن ترى نفس المفردة ولتكن ل¡ في كل مرة يظهر فيها اسم أحد المتغيرات داخل 
جملة المدخلات فعلى سبيل المثال إذا كانت المدخلات كالتالي: 


, SUM = SUM +X 
: فإن هذه الجملة لابد أن يتم تحويلها بواسطة محلل المفردات لتصبح‎ 
;id=id + id 


والتي تستخدم داخل وحدة الإعراب ولكن الأمر يتطلب التفرقة بين المتغير ل5 والمتغير × واللذان 
يظهران في الجملة الأصلية وهو ما لم يتضح في جملة المدخلات المستخدمة بواسطة وحدة الإعراب 
حیث تم استبدال جميع المتغيرات بدون تمييز بينها بالمفردات ل¡ وحل هذه المشكلة يتم ينفس الأسلوب 
e E‏ ۵ في كل مرة تظهر في 
جملة المدخلات الخاصة بوحدة الإعراب خاصية تقوم بتحديد اسم المتغير المرتبط بهذه المفردة. 


أما بالنسبة للكلمات المفتاحية ( sل٣مسرع))‏ وهي الكلمات المحجوزة التي تستخدم في جميع لغات 
البرمجة متل ¡f‏ و ٣ه‏ و عامس وغيرها من الكلمات التي يكون لها مدلول خاص داخل اللغة فإن مثل 
هذه الكلمات لا بد لوحدة تحليل المفردات أن تفرق ينها وبين أسماء المتغيرات وليتم ذلك فإن كل لغات 
البرمجة لا تسمح بإعطاء أسماء للمتغيرات يشابه الكلمات المفتاحية المحجوزة للغة وبالتالي فإن محلل 
المفردات يعتبر سلسلة الحروف المتتابعة هو اسم لأحد المتغيرات فقط إذا لم تتطابق سلسلة هذه الحروف 
مع أحد لكات المفتاحية إذا حدث ا فانه ر هي الكلمة المفتاحية ا تتکون من هذه 


كار من مفردة شكل مااع في جما المدخلات ت وخاصة في حالة اشتراك عدد من الكلمات المتاحية في 


4.. بناء محلل المفردات 


عند إضافة محلل المفردات بين وحدة الإعراب وسلسلة المدخلات يكون التفاعل بينها بالأسلوب 
الموضح في الشكل التالي : 
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حيث يتضح من الشكل أن محلل المفردات يقوم بقراءة الحروف بشكل متتابع وتجميعها في مجموعة 
لتكون حروف مفردات اللغة ثم يقوم بإرسال كل مفردة على حدة مع الخصائص التي تعبر عن قيمتها 
إلى وحدة الإعراب ولكن في بعض الأحيان قد يضطر محلل المفردات إلى قراءة بعض الحروف 
الإضافية قبل أن يستطيع تحديد المفردة التي تمتلها هذه الحروف فعلى سبيل المثال عند قراءة الحرف 
>" فإنه لا بد من قراءة الحرف التالى لتحديد ما إذا كانت تمثل المفردة الخاصة بعملية المقارنة ' أكبر 
من ' أم تمثل جزء من المفردة الخاصة بعملية المقارنة ' أكبر من أو تساوي ' فإذا كان الحرف التالي هو 
الحرف '=' فهذا يعنى أنها تمثل المفردة الثانية أما إذا كان بداية حرف مفرده جديدة فإن ذلك يعنى أنها 
ل :افر ةة الأول والخاضة تة المار ةة أك هن وقي هذه الحالة الاخيرة فان مطل العفر دات 
يكون قد قرأ حرف زيادة خاص بمفردة أخرى لذلك من الضروري إرجاع هذا الحرف الزائد إلى سلسلة 
المدخلات مرة أخرى حتى ينتظم أداء محلل المفردات ويستمر بشكل سليم. 


أما بالنسبة للتفاعل بين محلل المفردات ووحدة الإعراب فإن محلل المفردات غالبا ما يقوم بإرسال 


المفردات التي يحققها إلى وحدة الإعراب مفردة تلو الأخرى وليست كمجموعة من المفردات مرة واحدة 
لذلك فإن المعتاد أن تقوم وحدة الإعراب باستدعاء محلل المفردات لطلب مفردة جديدة مع تحديد 


خصائصها المختلفة وسوف نقوم الآن ببناء محلل المفردات الذي سيسمح للتعبير الرياضي أن يتضمن 
على مسافات بيضاء مثل التي سبق شرحها وكذلك إمكانية استخدام الأعداد وليست الأرقام فقط كأطراف 
للعمليات الحسابية التي يتضمنها التعبير الرياضي على أن نؤجل التعامل مع المتغيرات إلى الجزء 
التالي. 


والوظيفة التالية عبارة عن محلل للمفردات للتعبير الرياضي البسيط مكتوب بلغة السي يقوم بإهمال 
المسافات البيضاء التي تظهر في التعبير وكذلك تجميع الأعداد: 


<include <stdio.h# 

< include < ctype.h # 
;int lineno =1 

; int tokenval = NONE 
()int lexan 

1 

;intt 

} (while (1 

;, t=getchar 


(if(t=='' | | t=='\t 
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(else if ( t == '\n 

; lineno = lineno + 1 
} ( (else if ( isdigit (t 
; 'Otokenval = t— ' 

; t= getchar 


} ( (while ( isdigit(t 


: tokenval = tokenval * 10 + t -'O0 


; t= getchar 

{ 

; (ungetc (t , stdin 
, return NUM 

{ 

} else 

; tokenval = NONE 


;, return t 


{ 
{ 
{ 


Compiler for msc of cs 


حيث تقوم الوظيفة "ه×ه| بالتكرار وفي كل مرة يتم قراءة حرف. فإذا كان هذا الحرف مسافة فردية 
أو متعددة لا يتم إرجاع أي مفردة لوحدة الأعراب ويستمر في التكرار. أما إذا كان الحرف هو الحرف 
الخاص بالانتقال لسطر جديد فإنه يتم زيادة المتغير |٣٠٣١‏ لمتابعة رقم سطر المدخلات دون إرجاع 
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أي مفردة لوحدة الإعراب. أما في حالة قراءة سلسلة من الأرقام التي تكون أحد الأعداد فسيتم إرجاع 
المفردة num‏ مع تحديد قيمة العدد ووضعها في المتغير أاة۷"ع )همع . ما عدا ذلك من حروف فإنه یتم 
إرجاعها كما هي إلى وحدة الإعراب على اعتبار أنها تمثل إحدى العمليات الحسابية. 

ويجب الأخذ في الاعتبار أنه للسماح باستخدام الأعداد مع التعبيرات الرياضية فإن الأمر يتطلب إجراء 
تغير في القواعد النحوية الأخيرة الخاصة بالتعبير الرياضي بحيث يتم وصف الرمز اللانهائي 
<ص > بالشكل التالي: 

( <term> ( <exp> 

{ (num { print(num.value | 

بدلا من وصفه عن طريق الأرقام المنفصلة كما كان في السابق وبناء على ذلك فإن الإجراء الخاص 
بهذا الرمز اللانهائي <"٠۲ع)>‏ في وحدة الإعراب سوف يتغير ليصبح كما يلي : 


term 


} 

} (' )' = = if (lookahead 

;( '( )match( '(" ); exp; match 

{ 

} (else if (lookahead = = NUM 


;(printf ("%d", tokenval); match(NUM 


{ 


;() else error 


{ 


. إدماج جدول الرموز 


دائما ما يستخدم إحدى هياكل البيانات تسمى جدول الرموز ( ماطة۲ امطصر؟) وذلك للاحتفاظ 
بمعلومات عن تراكيب لغة برنامج المصدر المختلفة هذه المعلومات يتم تجميعها أثناء مراحل التحليل 
الخاصة بالمتر جم وذلك لاستخدامها خلال مرحلة التجميع لتوليد شفرة البرنامج المستهدف فمتلا أثناء 
تحليل المفردات يتم تخزين الحروف التي تكون اسم أحد المتغيرات داخل إحدى خانات جدول الرموز 
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على أن تستكمل باقي المعلومات الخاصة بهذا المتغير من نوع وطريقة ومدى الا ستخدام ومکان تخزین 
القيمة الخاصة به خلال المراحل التالية من عملية الترجمة حيث نستخدم تلك المعلومات أثناء توليد 


الشفرة المستهدفة وذلك اتحديد الشفرة المناسبة لتخز ين واستخدام هذا المتغير. 
و 2 ين و م 


وسنقوم الآن في هذا الجزء باستعراض كيفية تفاعل محلل المفردات مع جدول الرموز وذلك عن طريق 
استخدام بعض الوظائف التي تقوم بتخزين أو استرجاع تلك الرموز من جدول الرموز فعند تخزين أحد 
الرموز يتم أيضا تخزين مفردة اللغة المرتبطة بهذا الرمز والعمليتان التاليتان يتم تنفيذهما على جدول 
الرموز : 


هذه العملية تقوم بإضافة خانة جديدة داخل جدول الرموز أ( † , ء) ا6ك"¡ يخزن فيها مجموعة 
الحروف ١‏ التي تكون الرمز وكذلك المفردة † التي ينتمي إليها على أن تعود برقم فهرس هذه الخائة. 


هذه العملية تبحث عن الخانة التي تحتوي على الرمز الذي ا(ئ) مں‌)مها يتكون من مجموعة من 
الحروف ء وتعود برقم فهرس هذه الخانة إذا كان موجود وألا يكون رقم الفهرس 0 . 


ويقوم محلل المفردات باستخدام العملية الثانية لتحديد ما إذا كان أحد الرموز قد ظهر من قبل ولديه خانة 
في جدول الرموز أم أنه يظهر لأول مرة وعند ذلك يستخدم العملية الأولى لإضافة خانة جديدة له في 
جدول الرموز. 
5. معاملة الكلمات المفتاحية المحجوزة 

إن الكلمات المفتاحية المحجوزة ) (Reserved Keywords‏ يتم التعامل معها باضافة خانة خاصة 


لكل منها داخل جدول الرموز عند إنشاؤه وقبل ظهور أي رموز أخرى وبالتالي لا يمكن تسمية أي 
متغیر باسم يشابه أحد هذه الكلمات فمتلا إذا كانت اللغة تتضمن الكلمات المحجوزة ۴0۲ و عاiإw‏ 


کمفر دات في هذه اللغة بنفس الأسماء for‏ و while‏ فعند بداية إنشاء جدول الرموز يتم تنفید ١‏ لعمليتين 
الآتيتين: 


;(insert ("for",for 
;(insert ("while", while 


وعند ذلك فان أي عملية lookup("for")i‏ تالية تحدد أنها تنتمي لمفردة اللغةَ 0٣‏ وبالتالي لا یمکن 
تسمية آي متغیر بهذا الاسم في هذه اللغة, 


4.. تطبيق جدول الرموز 

الآن وبعد استخدام جدول الرموز يمكن استخدام المتغيرات داخل التعبير الرياضي وهو ما سيؤدي إلى 
إجراء بعض التعديلات على الوظيفة الخاصة بمحلل المفردات لتصبح كما يلي بعد إعادة كتابتها بلغة 
السي: 


<include <stdio.h # 
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<include <ctype.h#‏ 
;[char lexbuf [BSIZE‏ 

,int lineno =1 

,int tokenval = NONE 
int lexan 

;intt 

} (while (1 

; t= getchar 

CEES ITE 
(else if (t == '\n 

;lineno = lineno + 1 

} ( (else if ( isdigit(t 
;(ungetc(t , stdin 
;,(scanf("%d", &tokenval 
,return NUM 

{ 

} ( (else if ( isalpha(t 

; int p, b =0 


} ( (while ( isalnum(t 


Compiler for msc of cs 
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;lexbuf[b] = t 

;t = getchar 

;b=b+1 

(if (b >= BSIZE 

error 

{ 

;lexbuf[f] = EOS 

(if (t ! = EOF 

;(ungetc(t , stdin 

;(p = lookup(lexbuf 
(if (p == 

;(p = insert(lexbuf, ID 

;tokenval = p 

;return symtable[p].token 

{ 

(else if (t == EOF 

,return DONE 

} else 

;tokenval = NONE 

„rFeturn t 


{ 


Compiler for msc of cs 
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{ 
{ 


حيث يلاحظ أن محلل المفردات في نسخته الأخيرة عندما يقرأ حرف أبجدي يقوم بتخزين الحروف 
الأبجدية أو الرقمية داخل المخزن الوسيط fاط»ه|‏ وعند الانتهاء من تجميع حروف الاسم يقوم بالبحث 
عنه داخل جدول الرموز باستخدام العملية مں)هه| ولأن جدول الرموز يحتوي على جميع الكلمات 
المحجوزة للغة منذ إنشائه فإنه لن يسمح أن يكون هذا الاسم خاص بأحد المتغيرات وبالتالي يتعامل معه 
على أنه كلمة مفتاحية لها مدلول خاص باللغة إما إذا لم تكن كذلك ولم تظهر من قبل يتم إضافته إلى 
جدول الرموز باستخدام عملية ۲۲عءم¡ على اعتبار انه اسم لأحد المتغيرات وعند ذلك يتم إرسال قيمة 
الفهرس الخاص بهذا المتغير داخل جدول الرموز إلى وحدة الإعراب عن طريق المتغير اج۷ع )هخ 
وكذلك ما يفيد أن هذه الحروف تمثل اسما لمتغير. 

تحليل المفردات 


LEXICAL ANALYSIS 


إن وظيفة محلل المفردات هو قراءة حروف من برنامج المصدر ليشكل منها وحدات منطقية يتم التعامل 
معها في الأجزاء التالية من المترجم وهذه الوحدات المنطقية التي يكونها محلل المفردات هي مفردات 
(Tokens)‏ اللغة المكتوب بها بها البرنامج وتشبه عملية تشكيل الحروف في مفردات عملية تشكيل 
الحروف على هيئة كلمات في إحدى جمل اللغة الإنجليزية والتي تستلزم اتخاذ القرار المناسب عند 
تشكيل كل كلمة ليكون معناها متسق مع سياق الجملة الموضوعة فيها. 


ومفردات أي لغة هي عبارة عن عناصر أساسية يتم دائما تعريفها كأحد أنواع البيانات التي يتم حصر 


القيم التي من الممكن أن تأخذها في عدد محدد من القيم وهي الأنواع التي تسمى أنواع معددة 
(5ئeمypا‏ eratedصnumع)‏ فمتلاٌ يمكن تعريف المفردات بلغة السي كما يلي: 


typedef enum 
{ ,IF, FOR, WHILE, PLUS, MINUS, NUM, ID} 
;tokentype 


ومفردات لغة البرمجة يتم تصنيفها في عدة مجموعات تشمل مجموعة الكلمات المحجوزة مثل ۴| التي 
يتم تمثيلها بتدفق الحروف "۴" وكذلك تشمل مجموعة الرموز الخاصة مثل الرموز الرياضية كل۲1 و 
656 اللذان يتم تمثيلهما بالحروف "+" و "-" . وأيضا تشمل مجموعة المفردات التي يتم تمثيلها 
بسلاسل حروف متعددة مثل 0| و ۷ل" والتي تمثل المعرفات و الأعداد . 


وعموما فإن المفردات كوحدات منطقية يجب أن يتم التفرقة بينها وبين الحروف التي تمتلها. فمثلاً هناك 
فرق بين المفردة ۴| و بين الحروف "۴" التي تمثل هذه المفردة ولكي تكون هذه التفرقة واضحة يطلق 
على الحروف التي تمثل المفردة قالب المفردة (lLexeme)‏ وبعض المفردات يكون لها قالب واحد مثل 
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الكلمات المحجوزة بينما يوجد لبعض المفردات عدد غير محدد من القوالب التى يمكن تمثيل المفردة بها 
مثل الأرقام والمعرفات وفي هذه الحالة الأخيرة فإن تدفق الحروف التي تمثل المفردة لا بد من الاحتفاظ 
بها لذلك فإن المترجم يحتفظ بهذه الحروف فى جدول يسمى جدول الرموز (عاطة۲ امطصر؟) أثتاء 
عملية المسح التي تحدث خلال مرحلة تحليل المفردات وعموما فإن قيمة هذه الحروف التي تمثل كل 
مفردة تعتبر أحد الخصائص (Attributes)‏ التي ترتبط بالمفردة حيث يو جد خصائص أخرى للمفردات 
يتم إضافتها لكل مفردة موجودة في جدول الرموز حيث تحدث هذه الإإضافة خلال مراحل متفرقة من 
القرجمة 


وعلى الرغم من أن مهمة وحدة تحليل المفردات هي تحويل برنامج المصدر بالكامل إلى سيل من 
المفردات ولكن نادراً ما يتم ذلك كله مرة واحدة وإنما الذي يحدث غالبا وكما ذكرنا ذلك من قبل في 
الوحدة الثالثة فإن محلل المفردات وتحت تحكم وحدة الإعراب يقوم بإرجاع مفردة واحدة في كل مرة يتم 
فيها استدعائه من خلال الوظيفة التي يمكن أن تأخذ الشكل التالي في لغة السي: 


; (tokentype getToken (void 


فهذه الوظيفة المعرفة بالشكل السابق عندما يتم استدعائها تقوم بإرجاع المفردة التالية حسب المدخلات 
التي لديها كما تقوم بتحديد الخصائص الإضافية لهذه المفردة وغالبا لا تحصل هذه الوظيفة على سلسلة 
الحروف المدخلة في شكل معطيات ( كعم" ه۲ه۴) ولكنها تحتفظ بهذه المدخلات في مخزن وسيط 
)Buf۴٥۲(‏ وكمثال لذلك فإن وظيفة ٠)٠٣‏ ءج تعمل بافتراض وجود السطر التالي في شفرة برنامج 
ا 


a [index] = 4+ 2 


وبفرض أن سطر المدخلات السابق تم تخزينه في مخزن وسيط للمدخلات كالتالي : 


حیث يشير السهم للت موضع حرف المدخلات التالي فعند استدعاء وظيفة get oken‏ فانھا تحتاج الآن 


إلى إهمال المسافات الأربعة التي تظهر في بداية المدخلات ثم تقوم بالتعرف على حرف ال "ج" كقالب 
لمفردة يتكون من حرف واحد. 4 sl‏ عبارة E‏ لأحد e‏ 


ومن خلال الاستدعاء التالي لوظيفة getToken‏ ıتp‏ تكرار نفس الخطوات للتعرف على فتحة القوس 
التي تأخذ الحرف "۳" وهكذا إلى أن يتم تحليل مفردات سطر المدخلات بالكامل. 
. التعبيرات المنتظمة 
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إن التعبيرات المنتظمة (5٠اءوع۲م×ع‏ ةاعم ۸) هي إحدى طرق تمثيل القوالب الخاصة بسلاسل 
الحروف وكل تعبير منتظم م يتم تعريفه بالكامل بواسطة مجموعة سلاسل الحروف التي يتطابق معها. 
وهذه المجموعة تسمى اللغة التي يتم توليدها من هذا التعبير المنتظم ونرمز لها بالرمز أ(٣)1‏ ولا يوجد 
علاقة محددة بين لغات التعبيرات المنتظمة ولغات البرمجة وذلك لأن الأولى لغات بسيطة ولا تستخدم 
إلا في تمثيل أجزاء من لغات البرمجةء كما سنتعرف على ذلك فى الأجزاء التالية. وعموما فإن لغة 
التعبير المنتظم تعتمد إلى حد كبير على مجموعة الحروف والرموز التي تمثل أبجديات ( مط ه۲ماA)‏ 
اللغة والتي غالبا ما تشمل جزءا أو حتى كل الحروف التي تتكون منها شفرة ال ١ا©۸5‏ وأبجديات أي 
ل رم لها ارم اللات ج ( يجا و فة كرون عضن حررفة أحفات أك اللات عة معاي 
رلك على ضف مو فا د اكل تالظم د بك ارف ن نكل الخرف وخاد ر اكا ف 
يحتوي التعبير المنتظم على بعض الحروف التي يكون لها دلالات خاصة داخل التعبير حيث يطلق على 
هذه الحروف لفظ حروف أولية ( وعاءة2۲طء هم۷ ) وهذه الحروف في الواقع لا يمكن أن تتضمن 
عليها أبجديات أي لغة أو على الأقل يجب التمييز بينها بطريقة أو بأخرى. 


2.. تعريف التعبيرات المنتظمة 


سنقوم الآأن بوصف مضمون التعبيرات المنتظمة من خلال استعراض اللغات التي يمكن توليدها من 
کی ا ms Secs N‏ 
تعبيرات منتظمة جديدة من التعبيرات القائمة وذلك كما يحدث مع التعبيرات الرياضية. E‏ 
الجزء بأقل مجموعة من التعبيرات المنتظمة التي تحتوي فقط على العمليات والحروف الأولية الأساسية 
ولكن فى الجزء القادم سنضيف مجموعة أخرى من التعبيرات المنتظمة. 


2 التعبيرات المنتظمة البسيطة 


هذا النوع من التعبيرات المنتظمة يتكون فقط من حروف مفردة من حروف أبجديات اللغة التي تتطابق 
مع نفسها. بفرض أن الحروف "ه" من حروف الأبجدية ‏ فإن التعبير المنتظم ج يتطابق مع الحرف 
وو هداما ن شقان 


{L(a) = 


بالإضافة إلى ذلك هناك رمزان يتم استخدامهما في بعض الحالات الخاصة. الرمز الأول يستخدم للتعبير 
عن السلسلة الفارغة من الحروف ( ع١٣5‏ رام "ع) وهي السلسلة التي لا تحتوي على أية حروف 
حيث يرمز لها بالرمز € (ايبسلون) ويتم التعبير عن ذلك بان : 

{L(€) =‏ 
والرمز الثاني هو حالة اللغة الفارغة التي لا تحتوي على أي سلاسل من الحروف حيث يستخدم الرمز 


© في ذلك ويتم تعريف هذه اللغة كما يلي : 


{} = (L(O 
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ويجب ملاحظة أن هناك فرةقا بين الحالتين السابقتين لأن الحالة الأولى تمتل اللغة التي تحتوي فقط على 
السلسلة الفارغة من الحروف بينما في الحالة الثانية فإن اللغة لا تحتوي على أي سلاسل من الحروف 
ولا حتى السلسلة الفارغة وعموما فان كلاهما يمثلان حالتان خاصتان من اللغات. 
217 تغمليبات التعدر ات المنتظمة 

يوجد ثلاثة عمليات أساسية للتعبيرات المنتظمة: العملية الأولى خاصة بالاختيار بين البدائل والتي 
يرمز لها بالحرف الأولي "|" والعملية الثانية خاصة بالدمج (۸ 0ة" عاةء"ه)) وهي التي يعبر عنها 
بالتتالي كما سيتضح من الأمثلة أما العملية الثالثة فخاصة بالتكرار ( ١هاممهR)‏ والتي يرمز لها 
بالحرف الأولى "*" وسنعطي الآن تراكيب المجموعة المقابلة لهذه العمليات وذلك عن طريق تقديم 
اللغات التي تتطابق معها. 
أو : الاختيار بين البدائل 
إذا كان كل من ۲ و ء تعبيران منتظمان فإن ء | ۲ هو التعبير المنتظم الذي يتطابق مع أي سلسلة من 
ذلك فإن لغة التعبير المنتظم ء | ۲ تتكون من إتحاد لغتي التعبيران المنتظمان ۲ و ء وهو ما يتم التعبير 
(L(r | s) = L(r) U L(s‏ 
وعلى سبيل المثال بفرض التعبير المنتظم ط | ج فإنه يتطابق مع أحد الحرفين ج أو ط بمعنى أن: 
{L(a | b) = L(a) U L(b) = {a} U {b} = {a, b‏ 


أما ال المذةة فانه بتطاة السلسلة الت , تتكو زم من حر ف واحد هو 'وج' أو السلسلة الفار غة 
بی € | ج فإنه يتطابق مع ي تتکون من حرف واحد هو '۾' او ر 
التي لا تحتوي على أي حروف بمعنى أن: 


{ L(a | €) = {a,€ 


مع ملاحظة أن عملية الاختيار بين البدائل لا تقتصر فقط على الاختيار بين بديلين ولكن تمتد للاختيار 
بين أكثر من بديلين فمثلا: 


{L(a | b | c | d)={a, b,c, d 


وفي حالة وجود متتابعة من البدائل فان النقاط الثلاثية "" قد تستخدم في التعبير عن ذلك فمتلاً التعبير 
المنتظم ط | a‏ | | < يتطابق مع أي من الحروف الأبجدية الصغيرة بدءً من حرف 'ه' وحتى حرف '7' 
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ثانيا : الدمج : 

أن عملية الدمج بين التعبيران المنتظمان ۲ و ء والذي تكتب بالتعبير المنتظم ء والذي يتطابق مع جميع 
سلاسل الحروف الناتجة عن دمج سلسلتين من الحروف الأولى تتطابق مع التعبير المنتظم ٣‏ والثانية 


تتطابق مع التعبير المنتظم ء فمثلا التعبير المنتظم طه يتطابق فقط مع سلسلة الحروف "طه" بينما 
التعبير المنتظم » (ط | ه) فإنه يتطابق مع سلستي الحروف "ج" و "ظط" وهو ما يمكن التعبير عنه كما 


يلي: 
{L((a | b) c ) = L(a | b) L(c) = {a, b} {c} = {ac,bc‏ 

ويمكن ان تتضمن عملية الدمج أكثر من تعبيرين منتظمين بمعنى أن : 

(L(rn (rn) = L(r1) L(r2 L(r1 r2 

عملية تكرار التعبير المنتظم والتى تكتب ۲*۲ وذلك لإجراء التكرار على التعبير المنتظم ۲ حيث يتطابق 
التعبير المنتظم ٣*۲‏ مع أي عدد منتهي من عمليات الدمج المتتالية لسلاسل الحروف التي تتطابق مع 
ا بد 1 ا ۲ فمثاه ( بد 1 a*i Pk‏ يتطابق مع سلاسل الحروف a‏ و "aa"‏ و "aaa"‏ وهکذا 
كما يتطابق أيضا مع السلسلة الفارغة من الحروف € ولتوضيح عملية التكرار بشكل أفضل سنقوم 


باجرائها على اللغات التي يمكن توليدها من إجراء نفس العملية على مجموعة من سلاسل الحروف 
وبفرض أن 5 هي مجموعة سلاسل حروف فإن: 


S*={€}USUSS U SSS U 


حيث ہ5 عبارة عن عملية الدمج ل 5ك ك عدد م من المرات كما أن ا[€) = 0 وبالتالي فإن عملية 
التكرار يمكن تعريفها الان كما يلي: 


*(L(r*) = L(r 
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وعلى سبيل المثال فإن التعبير المنتظم *(طط | ه) يتطابق مع أي من سلاسل الحروف € و جو طط و 
a2‏ و ab‏ و aطط‏ و ططط و aaa‏ و طاطههج وهكذا وهو ما يمكن التعبير عنه كما يلي: 


*{L((a | bb)* ) = L (a | bb)* = {a | bb 


{ ,€, a, bb, aa, abb, bba, bbbb, aaa, aabb, abba} = 


2 أولويات العمليات واستخدام الأقواس 


في حالة وجود أكثر من عملية في التعبير المنتظم مثل *ط | ج فإنه لا بد من تحديد أولوية تنفيذ 
العمليات وهل تكون الأولوية لعملية الاختيار بين البدائل كما لو كانت “(ط | )a‏ أم تكون الأولوية لعملية 
التكرار بان تصبح ا(*() | ج فبالطبع هناك فرق بين الحالتين كما يتضح مما يلي: 


1,L((a | b)*) = {€, a, b, aa, ab, ba, bb, aab, aba, baa 


{ ,L (a | (b*)) = {€, a, b, bb, bbb, bbbb, bbbbb 


وعموما فإن المعتاد بالنسبة لتنفيذ العمليات أن تكون أعلى أولوية لعملية التكرار ثم لعملية الدمج وأخيرا 
لعملية الاختيار بين البدائل وبالتالي فإنه بالنسبة للمثال السابق فإن التفسير الثاني هو السليم وبالنسبة 
للتعبير المنتظم *ءط | ج يتم تفسيره ليكون ((*ء)ط) | ج وأيضا التعبير المنتظم ل*» | طه فإن تفسيره 
يكون (4(*)) | (طa)‏ وبصفة عامة فإنه عند الاحتياج لتنفيذ العمليات بأولويات غير الأولويات المعتادة 
فانه یمکن استخدام الأقواس للقيام بهذا التغير. فمثذلا يتم استخدام الأقو اس ذ في التعبير المنتظم 


> (ط | ه)¡ وذلك لكي يتم تنفيذ عملية الاختيار بين البدائل قبل عملية الدمج ونفس الحال بالنسبة للتعبير 
المنتظم *(طط | ه) حيث يتم استخدام الأقواس لجعل عملية الاختيار بين البدائل تسبق عملية التكرار 
ويلاحظ مدى التشابه بين دور الأقواس في تغير أولويات تنفيذ العمليات بالنسبة للتعبيرات المنتظمة مع 
نفس الدور التي تقوم به في تغير أولويات تنفيذ العمليات الحسابية في التعبيرات الرياضية. 

تسمية التعبيرات المنتظمة 


غالبا ما يكون إعطاء أسماء للتعبيرات المنتظمة من الأمور المستحبة وذلك لكونه يبسط من شكل 
التعبير المنتظم لأن استخدام الاسم بدلا من التعبير المنتظم ذاته وخاصة في التعبيرات المنتظمة المركبة 
يسهل من عملية كتابة واستخدام التعبير المنتظم فمتلاً عند إعداد تعبير منتظم للأعداد الصحيحة التي 
تتكون من سلسلة من الأرقام العشرية فإن التعبير المنتظم يكون كما يلي في صورته الأصلية: 
)2|1|10)(9||2|110| |9 
ولكن عند إعطاء اسم للتعبير المنتظم الخاص بالأرقام العشرية وليكن كالآتي : 
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9| | digit =0 | 1| 2 

وذلك التعريف المنتظم للاسم عاك يمكن من إعادة كتابة التعبير المنتظم السابق ليصبح كما يلي: 

*digit digit 

وبالرغم من أن استخدام التعريفات المنتظمة يبسط من شكل التعبير المنتظم ولكن تكمن المشكلة في 


صعوبة التفرقة بين اسم التعبير المنتظم وبين عملية الدمج لمجموعة الحروف التي يتكون منها هذا 
الاسم. 


والآن نقدم مجموعة من الأمثلة الإضافية للتعبيرات المنتظمة حيث نقوم في كل مثال بإعطاء وصف 
نصي لسلاسل الحروف المطلوب تمتيلها قبل ترجمتها في شكل تعبير منتظم وهي المهمة التي غالبا ما 
تواجه الشخص الذي يقوم بكتابة المترجمات والذي يقع عليه عبء وصف مفردات اللغة الذي يقوم 
بإعداد المترجم الخاص بها حيث غالبا ما يتم هذا الوصف فى شكل منتظم كما هو الحال بالنسبة 
للتعبيرات tk ١‏ لمنتظمة. 


مثال 1 
بفرض أبجدية بسيطة تتكون من تلاثة حروف فقط كالآتي : 
{a,b,c}=2>‏ 


وان مجموعة سلاسل الحروف التي يتم اشتقاقها من هذه الأبجدية تحتوي جميعا على حرف ط مرة 
واحدة فقط ففي هذه الحالة نجد أن هذه المجموعة يمكن وصفها بالتعبير المنتظم الآتي: 


*(a | c)*b (a | c) 


حيث يلاحظ أنه على الرغم من ظهور حرف ال ط في منتصف التعبير المنتظم فإن هذا الحرف ليس من 
الضروري أن يكون في منتصف سلاسل الحروف الذي يمكن اشتقاقها من هذا التعبير ولهذا فإن تكرار 
حرفي ال ج و ال ع قبل وبعد حرف ال ط يمكن أن يحدث بعدد مرات مختلف وجميع سلاسل الحروف 
التالية تتطابق مع التعبير المنتظم السابق: 


b, abc, abaca, baaac, ccbca, cccccb 
2 مال‎ 


بفرض نفس الأبجدية التي في المثال السابق ولكن مجموعة سلاسل الحروف تحتوي على حرف ال ط 
مرة واحدة على الأكثر فعند ذلك فإن التعبير المنتظم لهذه المجموعة الأخيرة يمكن أن يتحقق باستخدام 
نفس الحل الخاص بالمثال السابق ولكن كأحد بديلين وهي الحالة التي يظهر فيها الحرف ط لمرة واحدة 
أما في حالة عدم ظهور هذا الحرف فإن التعبير المنتظم *(ء |ه) يستخدم كبديل آخر وبالتالي فإن 
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*(a | c)* | (a | c)* b (a | c) 


ويمكن أيضا استخدام التعبير المنتظم التالي كحل آخر بديل: 


*(a| c)* (b | e) (a | c) 


وبالتالي فإن هذا المثال يقودنا إلى نقطة مهمة وهي أن نفس اللغة يمكن توليدها بواسطة عدة تعبيرات 
منتظمة مختلفة ولكننا عموماً نحاول بقدر الإمكان إيجاد أبسط التعبيرات المنتظمة التي تو صف سلاسل 


الحروف التي تتكون منها اللغة. 
0 


بفرض مجمو عة من سلال الحروف يتم تكوينها من الأبجدية [ ط ,ج ) بحيث يظهر حرف ال ط في كل 
منها مرة واحدة على أن يحاط بحرف ال ج بعدد متساوي من المرات وذلك مثل سلاسل الحروف التالية: 


,b, aba, aabaa, aaabaaa, aaaabaaaa 


فهذه المجموعة لا يمكن وصفها باستخدام التعبيرات المنتظمة وذلك لان العملية الوحيدة للتكرار التي 
نملكها لا نستطيع بها تحديد عدد مرات التكرار وإذا استخدمنا التعبير المنتظم *جط*ه فإننا لا نستطيع 
أن نشترط أن عدد مرات تکرار حرف ال ۾ قبل حرف ال ط لا بد أن یتساوی مع عدد مرات تكراره بعد 
حرف ال ط ومن هذا المثال نستطيع استنتاج أن ليس جميع مجموعات سلاسل الحروف يمكن ن¿ وصفها 
HTT EIT‏ 
الط )56 RT (Rês ular‏ الو کر ا ا ا البرمجة 
من أصعب المشاكل التي تواجه عملية تحليل مفردات هذه اللغات. 


مثال 4 

بفرض سلاسل من الحروف التي تتكون من الأبجدية [ ء,ط,ة) = ك وان هذه السلاسل لا تحتوي على 
حرفين متتاليين من حرف ال ط وبالتالي فإن أي حرفين من ال ط لا بد أن يظهر بينهما على الأقل أما 
حرف ال ج أو حرف ال ع ففي هذه الحالة نستطيع بناء التعبير المنتظم الذي يوصف تلك السلاسل من 
الحروف على عدة مراحل ولنبدأً بالجزء الذي يضمن ظهور حرفي ال ج أو ال ع بعد حرف ال ط وذلك 
باستخدام التعبير المنتظم التالي: 


*((b (a | e) 
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وبعد ذلك نضيف له التعبير المنتظم *(ء | ج ) الذي يتطابق مع الحالات التي لا يظهر فيها حرف ال ط 
ضمن سلسلة الحروف وبالتالي فإن التعبير المنتظم سيصبح كما يلي: 


*(*((a | c)* | (b (a | c)) 

أن التعبير *(i*ء‏ | )٣*‏ يكافئ التعبير *(ء | )٣‏ فإن التعبير المنتظم السابق يمكن تبسيطه ليصبح 
لي. 

*(((a | c) | (b (a | c)) 

وهو ما يمكن ايضا إعادة كتابته ليكون كالتالي: 


*(a| c | ba | bc) 


وهذا التعبير المنتظم الأخير يضمن عدم ظهور حرفين متتالين من حرف ال ط ولكنه يهمل حالة سلاسل 
الحروف التي تنتهي بحرف ال ط فمثلا لا يمكن اشتقاق سلاسل الحروف التالية من التعبير المنتظم 
الأخير: 

,b, ab, cb, acb, cab, aab 

على الرغم من أن هذه السلاسل لا تحتوي على حرف ال ط إلا مرة واحدة وبالتالي لا يوجد حرفان 


متتاليين من هذا الحرف ولكي نصحح ذلك نضيف للتعبير المنتظم السابق جزء اختياري في نهايته 
ليغطي هذه الحالات المشار إليها وليصبح التعبير المنتظم كما يلي: 


(a | c | ba | bc)* (b |e) 


مع ملاحظة أن التعبير الأخير يمكن أن يولد نفس سلاسل الحروف عن كتابته بالعكس وهو عندما يكون 
كالتالي: 


*(b | e) (a | c | ab | cb) 


ويمكن أيضا إعادة كتابته ليكون كمايلي: 
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(notb | b notb )* (b | €) 


حيث تمت الاستعاضة عن الجزء > | هج بالتسمية طاهمم وذلك مثال لاستخدام الأسماء داخل التعبير 
المنتظم من اجل التبسيط وهو الإجراء المستحب وخاصة في حالة ما اذا كانت تحتوي فيه الأبجدية على 
عدد كبير من الحروف. 


مثال 5 


في هذا المثال الأخير سنقوم بالعكس وهو تقديم تعبير منتظم على أن نقوم بالتوصل إلى مجموعة سلاسل 
الحروف التي يمكن اشتقاقها من هذا التعبير وبفرض أن أبجدية هذه اللغة تشمل الحروف ‏ > , {a,b‏ 
وأن التعبير المنتظم كان كالتالي: 


*(b | c)* a (b | c)* a)* (b | c)) 


فهذا التعبير المنتظم يولد اللغة التي تتكون من سلاسل الحروف التي تحتوي على عدد زوجي من حرف 
ال ج سواء متتالية أو يفصل بينها حرفي ال ط أو ال ع ولتوضيح ذلك فإن الجزء الأيسر من هذا التعبير 
المنتظم والذي يتكون من الجزء التالي: 


b | c)* a (b | c)* a) 


يولد سلاسل الحروف التي تتكون من حرف ال ج مرتان فقط وأي عدد من حرفي ال ط أو ال ء على أن 
يكون عدد المرات ظهور هذا الحرف زوجي أما الجزء الأخير فإنه يغطي الحالات التي لا تنتهي فيها 
سلاسل الحروف بحرف ال ج 


2 إضافات التعبيرات المنتظمة 


لقد تم في الجزء السابق تعريف التعبيرات المنتظمة التي تستخدم الحد الأدنى من العمليات حيث تم 
الاكتفاء بالعمليات الشائعة في التطبيقات المختلفة و اقتصر الأمر على استخدام ثلاثة عمليات فقط في 
جميع الأمثلة السابقة ولكننا قد لاحظنا أن استخدام هذه العمليات فقط يصعب من عملية إنشاء التعبيرات 
المنتظمة ويجعلها أكثر تعقيدا لهذا فسوف نقوم الآن بوصف بعض العمليات الإضافية الخاصة 
بالتعبيرات المنتظمة مع إعطاء الرمز الخاص بكل عملية جديدة مع الأخذ في الاعتبار أن بعض هذه 
اعبات اين لها رر مسو عة زي ءالخالا سرف مي كر ررر یره باه 
لكل عملية من تلك العمليات. 


2 تكرار واحد أو أكثر 


بفرض أن ۲ هو احد التعبيرات المنتظمة فإن عملية تكرار هذا التعبير المنتظم والذي تكتب إ*۲ 
تسمح بتكراره صفر أو أكثر من المرات بمعنى أن الحد الأدنى للتكرار في هذه العملية يكون صفر من 
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المرات ولكن في بعض الأحيان نحتاج إلى أن يكون الحد الأدنى للتكرار هو مرة واحدة أي أن يصبح 
عدد مرات التكرار مرة واحدة أو كثر من المرات ولا نسمح بسلسلة الحروف الفارغة ومتال على ذلك 
بفرض أننا نريد إعداد تعبير منتظم ليصف الأعداد الثنائية فإن التعبير المنتظم *(1 | 0 )| سيسمح 
بوجود عدد ثنائي لا يحتوي على أي أرقام وهذا خطأً وحتى نتمكن من وصف الأعداد الثنائية بشكل 


“(1 |0 (1|0) 


ولكون هذه الحالة تحدث في أحيان كثيرة لذلك تم إضافة عملية التكرار التي يرمز لها بالرمز '+' والتي 
تعني أن التكرار يكون لمرة واحدة أو أكثر من المرات وبالتالي يمكن استخدامها مع التعبير المنتظم 
الذي يصف الإعداد الثنائية ليكون كالآتي: 


)0 | 1(+ 
2 أي حرف 


في حالات كثيرة نحتاج عند إعداد أحد التعبيرات المنتظمة إلى حدوث تطابق مع أي حرف من 
حروف أبجدية اللغة التي نريد وصفها بالتعبير المنتظم ففي هذه الحالة وبدون وجود رمز للتعبير عن أي 
حرف فإنه لا بد من ذكر جميع حروف الاأبجدية في شكل بدائل متعددة ولكن عندما تكون عدد حروف 
الأبجدية كبير فإن ذلك يكون صعب إن لم يكن مستحيل لذلك فإن الرمز '.' يستخدم للدلالة على أي 
حرف من حروف الأبجدية فمثلا التعبير المنتظم الذي يصف مجموعة سلاسل الحروف التي يظهر فيها 
حرف ال ط مرة واحدة على الأقل يمكن كتابته كما يلي: 


b +‏ + 
2 مدى الحروف 


غالبا ما نحتاج إلى كتابة مدى من الحروف المتتالية عند إعداد التعبيرات المنتظمة مثل مجموعة 
الحروف الأبجدية الصغيرة من حرف ال ' ج ' إلى حرف ال '7' والتي نعبر عنها الآن باستخدام الشكل ۾ 
ج | ... | ط | وكطريقة أخرى بديلة لذلك تستخدم الأقواس المربعة والشرطة للدلالة على ذلك فتكتب [ 
ج 8 ج ] وبنفس الطريقة فإن الشكل [ 7 8 24 8 ه] يستخدم للدلالة عن جميع الحروف الأبجدية في اللغة 
الانجليزية والشكل [ 0 9 ] للدلالة على الأرقام العشرية وهكذا مع ملاحظة أن هذه الطريقة في التعبير 
عن مدى من الحروف يعتمد على كون الشفرة الخاصة بالحروف الأبجدية أو الأرقام في شفرة ال 
01I‏ تاتي بشكل متتابع بمعنى أن شفرة حرف ال 'ه' يليها شفرة حرف ال 'ط' ثم شفرة حرق ال 'ع' 
وهکذا. 
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في بعض الأحيان نحتاج إلى استبعاد مجموعة من الحروف من ضمن بدائل حروف أبجدية في 
إحدى اللغات وللتعبير عن ذلك حاليا لا بد من حصر جميع حروف الأبجدية الخاصة باللغة مع استبعاد 
الكرفت أو ر عة انكو ن ا ا تر ت الد و كن د تحضر كن حت در اة 
عدد حروف الأبجدية ويستعاض عن ذلك باستخدام الرمز '' الذي يعني النفي أو المكمل 
(ementامpصهc)‏ لمجمو عة البدائل فمتلاً التعبير المنتظم التالي: 


(a | b|c) 7~ 


N CSG E LS 
يعني أي‎ SEA RSS E 


2 جزء اختياري 


في حالات عديدة نريد إيضاح أن أحد أجزاء التعبير المنتظم اختياري بمعنى أن سلاسل الحروف 
التي يمكن توليدها من ذلك التعبير المنتظم قد تحتوي على هذا الجزء أو لا تحتوي عليه فمثلا لوصف 
الأعداد الصحيحة التي قد تحتوي على إشارة موجبة أو إشارة سالبة للدلالة على الأعداد الصحيحة 
الموجبة والسالبة ومع ذلك فإن العدد الصحيح قد لا يحتوي على أي إشارة وهو ما يدل أيضا على أن 
العدد الصحيح موجب وهذا ما يعني أن الإشارة اختيارية في العدد الصحيح ولوصف ذلك حاليا فإن 
التعبير المنتظم يكون كما يلي: 


+[9 0] (| *)| *[9 O] 


وبدلا من إعادة كتابة التعبير المنتظم بدون الجزء الاختياري فإن رمز علامة الاستفهام '?' يستخدم 
للدلالة عن الجزء الاختياري وبالتالي فإن التعبير المنتظم السابق يمكن إعادة كتابته ليصف الأعداد 
الصحيحة مع استخدام رمز الجزء الاختياري ليصبح التعبير المنتظم کما يلي: 


)*|-(? ]0 9[ 
. استخدام التعبيرات المنتظمة لوصف مفردات لغات البرمجة 


إن مفردات أي لغة من لغات البرمجة يمكن تصنيفها في مجموعات محددة وهذه المجموعات غالبا 
لا تختلف من لغة برمجة إلى أخرى. فهناك مجموعة خاصة بالكلمات المحجوزة ( إع۷إ٥ئمR‏ 
6/))) والتي تشمل على مجمو عة الكلمات التي لها دلالة خاصة داخل لغة البرمجة متل ۴| و عاإW۷‏ 
وغيرها من الكلمات وكذلك هناك مجموعة الرموز الخاصة ( (Special Symbols‏ مثل الرموز 
الخاصة بالعمليات الرياضية وعمليات المقارنات والعمليات المنطقية وبعض هذه الرموز تتكون من 
حرف واحد مثل '+' و '*' و '<' و '=' والبعض الأخر تتكون من عدة حروف مثل ' ==' و '+ +'و '< 
=' وأيضا هناك مجموعة المعرفات ( ء٣ءا؟ا†"مل|)‏ والتي تستخدم كأسماء للمتغيرات أو الوحدات 
البرمحية وغالبا ما تبدأ هذه المعرفات بأحد الحروف الأبجدية متبوعا بعدد من الحروف الأبجدية أو 
الأرقام أو كلاهما وأخيرا هناك مجموعة الثوابت (ئا٣ة†ومه))‏ والتي تأخذ قيمة ثابتة سواء رقمية مثل 
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5 و 18.7 أو نصية مثل "٥ر8‏ 4مه6" أو حتى حرفية مثل '^' أو "!' وسوف نقوم الآن بوصف كل 
مجموعة من المجموعات المختلفة لمفردات لغات البرمجة باستخدام التعبيرات المنتظمة: 


22 الأعداد 


الأعداد يمكن أن تكون أعدادآ صحيحة ( sاعمطاصNu‏ rمعمtما)‏ تتكون من سلسلة أرقام مسبوقة 
بإشارة أو بدون إشارة أو تكون أعداداً كسرية (ئاعمطاصںل اجع۸R)‏ تحتوي على عدة أرقام قبل العلامة 
العشرية والأخرى بعد العلامة العشرية وقد تحتوي على إشارة وكذلك يمكن أن تكون الأعداد أعداد أسية 
Numbers)‏ lاonentiaم»E)‏ تحتوي علی حرف ال 'م' أو حرف ال '۴' متبوعاً بعدد صحيح ومسبوقا 
بعدد كسري مثل 212.4-ع¡ ويمكن الآن أن نكتب التعبير المنتظم الخاص بكل نوع من هذه الأعداد كما 
يلي: 


+[9nat = [ 0F 

int = (+ | -)? nat 

?(real = int ("." nat 

?( number = int ("." nat )? ((e | E ) int 

حيث يلاحظ أن وصف الأعداد الكسرية |إجمم يحدد أن الجزء الخاص بالعلامة العشرية وما بعدها يعتبر 
جزء اختياري وذلك على اعتبار أن العدد الكسري يمكن أن يكون عدد صحيح فقط ولا يحتوي على 
كسر وأيضا الأعداد الأسية تعتبر هي التعریف الأشمل للأعداد ٣٥ط‏ ہں" لأنها قد تكون عدد صحيح أو 
عدد كسري فقط ولهذا فإن تعريفها يحتوي على بعض الأجزاء الاختيارية وأخيرا يلاحظ أن العلامة 
العشرية قد تم وضعها بين علامتي تنصيص "." وذلك لعدم الخلط بينها كعلامة عشرية وبين الرمز 


الخاص بإحدى عمليات التعبيرات المنتظمة التي تعني أي حرف من حروف أبجدية اللغة كما أوضحنا 
سلفاً. 


2 الكلمات ١‏ لمحجو زه والمعرفات 

تعتبر الكلمات المحجوزة من أسهل ما يمكن وصفه باستخدام التعبيرات المنتظمه وذلك لأن كل منها 
يتكون من سلسلة ثابتة من الحروف وبالتالي فإنه يمكن تجميع جميع الكلمات المحجوزة في تعبير منتظم 
reserved = if | while | for‏ | 
أما المعرفات فان كل منها لا يتكون من سلسلة ثابتة من الحروف ولكن عادة ما يتكون المعرف من عدة 
حروف أبجدية وأرقام على أن يبدا بأحد الحروف الأبجدية ويمكن أن يتم وصف المعرفات بإستخدام 
التعريفات المنتظمة التالية: 
[letter = [a FH zA RZ‏ 
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[9digit = [O 


*(identifier = letter (letter | digit 


3.2 التعليقات 


إن التعليقات (ئا 0٥٣"٠‏ ) دائما ما يتم إهمالها عند مسحها بواسطة وحدة تحليل المفردات ولكن 
لكي يتم ذلك فإنه لابد من التعرف عليها أولا حتى يمكن استبعادها ولأن طريقة كتابة التعليقات قد تختلف 
من لغة إلى أخرى من لغات البرمجة لذلك فإن أسلوب التعرف عليها يتوقف على حسب الطريقة 
الخاصة بلغة البرمجة فمثلا في لغة الباسكال يكتب التعليق بالشكل التالي: 
{this is a Pascal comment}‏ 


حيث يتم كتابة سلسلة من الحروف التي بت يتضمنها ال لتعليق بين الحرفين المحددين [ ) بينما في لغة ٣‏ 
تستخدم حروف محددة مختلفة حيث تأخذ الشكل التالي: 


/* this is a C comment * / 


وفي لغات أخرى يكون للتعليق حرف أو حرفان لتحديد بداية التعليق ولكن لا يوجد حرف محدد لنهاية 
التعليق على إفتراض أن التعليق ينتهي بنهاية السطر الذي يحتوي عليه التعليق وذلك مثل التعليقات 
التالية: 


this is a prolog comment % 


this is an Ada comment 


وعموما فإن أعداد التعبير المنتظم الخاص بالتعرف على التعليقات يكون بسيطا عندما تكون تعليقات لغة 
البرمجة لها محددات بداية ونهاية يتكون من حرف واحد أوتكون لها محدد بداية فقط حتى لوكان ذلك 
يتكون من عدة أحرف ولكن تكمن الصعوبة عندما تكون للتعليقات الخاصة بلغة البرمجة لها محددات 
بداية ونهاية تتكون من عدة حروف فمتلا التعبير المنتظم الخاص بتعليقات لغة الباسكال يكون كما يلي: 
UD‏ 

حيث يشترط ان يبدأ التعليق بالحرف المحدد للبداية وهو '' وينتهي بالحرف المحدد للنهاية ']' وبينهما 
أي عدد من الحروف من أبجديات لغة الباسكال خلاف الحرف المحدد لنهاية التعليق الذي لابد الا يظهر 
في وسط التعليق ولكن مع نهايته فقط بينما التعبير المنتظم الخاص بتعليقات لغة البرلوج سيكون كما 
يلي: 


*(newline ~) % 
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والتعبير المنتظم الخاص بتعليقات لغة ال ةك۸ يكون كالآتي: 
*(newline ~)‏ 


حيث يفترض أن اسهم يتطابق مع الحرف الخاص بنهاية السطر والذي غالبا مايعبر عنه بالرمز 
في العديد من لغات البرمجة أما بالنسبة للتعليقات الخاصة بلغة السي فإن الصعوبة في إعداد تعبير 
منتظم في هذه الحالة تكمن في وجود محددات بداية ونهاية تتكون من أكثر من حرف حيث يستخدم 
الخرفان "/' كمحدد بذاية للتعليق والحرفان /*" يستخدمان كمحذد نهاية للتعليق لذلك فان التعزف على 
التعليقات الخاصة بلغة السي يتم بإسلوب مختلف وهذا سيتم تأجيله الأن وسوف نستعرض كيفية التعرف 
على التعليقات في متل هذه الحالات في نهاية هذه الوحدة. 

. الأتوماتة المنتهية 


إن الأتوماتة المنتهية ( Auta‏ مtام۴)‏ أو التي تسمى أحيانا بآلة الحالة المنتهية ( -عام۴ 
Machine‏ teهSt)‏ هي طريقة رياضية لوصف أنواع محددة من الخوارزميات ويمكن أيضا أن 
تستخدم في وصف عملية التعرف على الأنماط في سلاسل الحروف المدخلة ولذلك فأنها تستخدم في بناء 
الماسح الذي يقوم بتحليل المفردات ويوجد بالطبع علاقة قوية بين الأتوماتة المنتهية والتعبيرات المنتظمة 
وسوف نعرض في الجزء القادم كيفية بناء أتوماتة منتهية من تعبير منتظم وقبل أن نبداً دراسة الأتوماتة 
المنتهية دعنا نفترض المثال التوضيحي التالي: 


إن نمط المعرفات ( ء٣ءاfناهل!ا)‏ الشائع تعريفه في لغات البرمجة يمكن أن يوصف بواسطة التعبير 
E 1‏ التالي: 


*(identifiers = letter (letter | digit 
وذلك بفرض أن الأسماء المنتظمة )ها و اعا قد سبق تعريفها وبالتالي فان هذا التعبير المنتظم‎ 


الش رةو عة لفرت على مله اة من الحروف كن رها اة ام خط لتقت 
Diagram)‏ ransitionsا)‏ التالي: 


والدائرتان المرقمتان بالرقم (1) والرقم (2) في هذ | المخطط يمثلان الحالات ( ( كمه أو المراحل 
التي تمر عليها عملية التعرف حيث تسجل مختلف الأنماط التي يمكن أن نراها بينما تعبر الأسهم عن 
الانتقالات (5١٠ا†اومه٣۲)‏ والتي تسجل التغير من حالة لأخرى نتيجة لحدوث التطابق مع الحرف أو 
مع مجموعة الحروف الذي يعنونه كل سهم وفي المخطط السابق تعتبر الحالة رقم (1) هي حالة البداية 
(هtهSt‏ tاهSt)‏ وهي الحالة التي تبدأ عندها عملية التعرف على النمط ويتم تمييز تلك الحالة في 
المخطط من خلال سهم غير معنون ينتهي عند هذه الحالة وبدون وجود حالة سابقة يبدأ منها أما الحالة 
رقم (2) فهي تمتل الوضع عند وجود تطابق مع حرف آأبجدي والذي يعبر عن الإنتقال الممثل بالسهم 
المتجه من الحالة رقم (1) إلى الحالة رقم (2) والمعنون ب |٤٥٣‏ وبمجرد الوصول إلى الحالة رقم 
(2) فإن أي عدد من الحروف الأبجدية أو الأرقام يمكن أن نراها وعند حدوث التطابق مع أي منها نعود 
إلى الحالة رقم (2) مرة أخرى وعموما فإن الحالة أوالحالات التي تمثل نهاية عملية التعرف على النمط 
والتي يعني الوصول إليها نجاح تلك العملية تسمى بحالات القبول (عاه؟ عiاممعAc)‏ ويتم تمييزها 
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في مخطط الإنتقالات باستخدام الدائرة المزدوجة مثل الحالة رقم (2) في المخطط السابق والتي تعتبر 
حالة مقبولة أو منتهية وذلك لأن حدوت التطابق مع حرف أبجدي واحد أو مع حرف أبجدي يتبعه أي 
مقبول في لغة البرمجة. 


وعملية التعرف على سلسلة حروف محددة تمثل أحد المعرفات يمكن الأن التعبيرعنها بواسطة قائمة 
الحالات المتعاقبة و الأنتقالات من خلال المخطط الذي يستخدم في عملية التعرف على سلسلة الحروف 
فمثلا عملية التعرف على أو تمييز سلسلة الحروف هع كأحد المعرفات يمكن التعبير عنها كمايلي: 


حيث تم عنونة كل إنتقال بالحرف الأبجدي الذي يحدث التطابق في كل خطوة . 
3 الأتوماتة المنتهية الحتمية 


إن مخططا مثل المخطط الذي تم شرحه سابقا يستخدم بفاعلية لوصف الأتوماتات المنتهية وذلك 
لكونه يسمح لنا بمشاهدة أداء الخوارزميات بسهولة ولكن مع ذلك فإنه من الضروري وجود وصف 
رسمي ( 0۸م Desc‏ امصrه۴)‏ للأتوماتة المنتهية لهذا سنقوم الأن بتقديم تعريف رياضي لها ولكن 
لن نحتاج لمثل هذا التعريف في أغلب الأوقات ونعتمد فقط على المخططات لوصف أغلب الأمثلة 
الخاصة بالأتوماتة المنتهية ويجب أن نلاحظ أيضا أننا سنقوم فقط بوصف الأتوماتة المنتهية الحتمية 
)Deterministic Finite Automata)‏ والتي يطلق عليها إختصارا 5۴۸ وهي الاتوماتة التي يتم 
فيها تحديد الحالة التالية مع كل إنتقال حسب الحالة الحالية وحرف المدخلات الحالي فقط ويعتبرهذا 
النوع من الأتوماتة المنتهية هو حالة خاصة من الأتوماتة المنتهية غير انحتمیة ) Nondeterministic‏ 
Automata‏ teا۴|n)‏ وهي الاتوماتة التي سيتم دراستها لاحقا . 


والأن نقدم مجموعة من أمثلة الأتوماتية المنتهية الحتمية توازي الأمثلة السابق تقديمها مع التعبيرات 
1 ذا 2 
مثال 6: 


مجموعة سلاسل الحروف التي تحتوي على حرف أل ط مرة واحدة فقط يمكن قبولها بإستخدام الأتوماتة 
المنتهية الحتمية التالية: 


مثال 7 : 


مجموعة سلاسل الحروف التي تحتوي على حرف ال ط مرة واحدة على الأكثر يمكن قبولها باستخدام 
الأتوماتة المنتهية الحتمية التالية: 
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يلاحظ أن مخطط الإنتقالات في هذا المثال هونفس مخطط الإنتقالات الخاص بالمثال السابق ولكن مع 
إجراء تعديل بسيط وهو جعل حالة البداية رقم (1) إحدى الحالات المقبولة في المخطط الأخير. 


مثال 8 : 

في الجزء السابق قدمنا التعريفات المنتظمة للأعداد الثابتة في شكلها العلمي كما يلي: 
+[9nat = [0‏ 

int = (+ | -)? nat 

?(real = int ("." nat 

?( number = int ("." nat )? ((e | E ) int 

ولإعداد 0۴۸ لسلسلة الحروف التي تتطابق مع هذه التعريفات فإنه من الأفضل إعادة كتابة تلك 
التعريفات المنتظمة لتصبح كما يلي : 

[9digit = [O 

+nat = digit 

int = (+ | -)? nat 

?(real = int ("." nat 

?( number = int ("." nat )? ((e | E ) int 


والآن من السهل إعداد 0۴۸ للأعداد الطبيعية (2") والذي یکون كالاتي: 


الأتومانة المنتهية الحتمية الكاملة للأعداد الثابتة. 


وبالنسبة للأعداد الصحيحة ( |١‏ ) فإن الأتوماتة المنتهية الحتمية الخاصة بها يزداد قليلاً في صعوبته 
وذلك بسبب الجزء الإختياري الخاص بالإشارة حيث نلاحظ أن العدد الصحيح يمكن أن يبدأ برقم 
عشري أو بإشارة ورقم عشري وبالتالي فإن مخطط الإنتقالات سيصبح كالآتي: 
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ويمكن بسهولة إضافة الجزء الإختياري الخاص بالكسر كما يلي: 


ويلاحظ أن مخطط الإنتقالات السابق يحتوي على حالتين مقبولتين وذلك ليعكس أن الجزء الخاص 
بالكسر جزء إختياري. وفي النهاية نحتاج لاضافة الجزء الإختياري الآخر والخاص بالجزء الأسي في 
الإعداد وللقيام بذلك يجب ملاحظة أن هذا الجزء يجب أن يبدأ بحرف ع أو حرف م ويمكن أن يحدث 
فقط بعد الوصول لأحد الحالتين المقبولتين وسيكون مخطط الإنتقالات الذي يصف الأتوماتة المنتهية 
الحتمية الخاصة بالتعرف على الأعداد كما يلي: 


مثال 9 : 


التعليقات التى توجد فى أغلب لغات البرمجة يمكن أيضا إعداد الأتوماتة المنتهية الحتمية للتعرف عليها 
وسنكتفي في هذا الجزء بالتعليقات التي لها محددات بداية ونهاية يتكون من حرف واحد مثل تعليقات لغة 
الباسكال الذي تستخدم الأقواس [ ) كمحددات حيث يتم كتابة سلسلة الحروف التي يتضمنها التعليق 
بينهما ويمكن وصف الأتوماتة المنتهية الحتمية الخاصة بالتعرف على تعليقات لغة الباسكال باستخدام 
مخطط الإنتقالات التالي: 


وكلمة ۲٠م‏ في المخطط السابق يعني جميع الحروف فيما عدا الحرف ' ' الخاص بنهاية التعليق . 


ألآن وبعد الإنتهاء من الأمثلة السابقة يجب ملاحظة أن مخطط الإنتقالات الخاص بأي أتوماتة منتهية 
حتمية لا يقو م بتمثيل كل الأشياء التي يحتاجها ولكن يعطي فقط إطار عام لعملياته وليس فقط ذلك وإنما 
SMe CS aS‏ 
اين شيررء مع حل محددء من حالات الأومقة اتبيه الحتية رمع لك ومن لاعية اخری تجد ا 
E‏ 
الذي يتم عند الوصول لأحد الحالات المقبولة أو عند حدوث التطابق مع أحد الحروف أثناء الإنتقال من 
حالة إلى أخرى والإجراء الفعلي الذي يتم عند حدوث هذا الموقف الأخير هوأن يتم نقل هذا الحرف من 
سلسلة حروف المدخلات إلى سلسلة الحروف المجمعة و التي تنتمي لمفردة محددة بينما الإجراء الذي 
يتم عند الوصول لأحد الحالات المقبولة هو أن يتم إرجاع المفردة التي تم التعرف عليها مع جميع 
الخصائص المرتبطة بها أما بالنسبة لما يتم عند الوصول لحالة الخطأ فإما أن يتم إرجاع جميع الحروف 
A N O‏ 

ومن ناحية أخرى فإننا نوجه إهتمامنا الآن إلى كيفية الوصول إلى حالة البداية في أي أتوماتة حتمية 
فمن المعروف أن جميع لغات البرمجة تتضمن عدة مفردات وكل مفردة من هذه المفردات يتم التعرف 
عليها بواسطة الأتوماتة المنتهية الحتمية الخاصة بها وإذا كانت كل مفردة تبدأ بحرف مختلف عن 
الأخرى فعند ذلك يكون الأمر سهل لانه في هذه الحاله يمكن دمج حالات البداية الخاصة بتلك المفردات 
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في حالة بداية واحدة وبالتالي تجميع الأتوماتة المنتهية الحتمية المختلفة الخاصة بها في أتوماتة منتهية 
حتمية واحدة مجمعة فمثلا بفرض المفردات التي تكون سلسلة الحروف التي تمثلها من '=' و '=>' و 
:=" وكانت الأتوماتة المنتهية الحتمية الخاصة بالتعرف على كل منها تأخذ الشكل التالي على التوالي: 


وحيث أن كل مفردة من تلك المفردات تبدأ بحرف مختلف فانه يمكن توحيد الأتوماتة المنتهية الحتمية 
الخاصة بكل منها في الأتوماتة المنتهية الحتمية التالية: 
وتكمن المشكلة إذا كانت هناك عدة مفردات تبدأ بنفس الحرف فمثلا المفردات '>' و '=>' و '<>' 


أن يكون هناك إنتقال وحيد من كل حالة من حالات الأتوماتة المنتهية الحتمية مع كل حرف من حروف 
أبجديتها وهذا لم يحدث في مخطط الإنتقالات المجمع التالي: 


وبدلا من ذلك يجب ترتيب الأتوماتة المنتهية الحتمية المجمعة بحيث يكون هناك إنتقال وحيد يحدث في 


قاعدة عامة يجب أن تكون هناك قدرة على دمج جميع المفردات في أتوماتة منتهية حتمية واحدة مشتركة 
بهذا الأسلوب السابق ولكن تعقيد مثل هذه المهمة قد يصبح كبيرا وخاصة إذا ما تم بطريقة غير منظمة 
وحل هذه المشكلة يمكن أن يحدث بتوسيع التعريف الخاص بالأتوماته المنتهية ليشمل إحتمال وجود أكثر 
من إنتقال واحد من إحدى الحالات مع بعض الحروف وهذا النوع الجديد من الأتوماتة المنتهية تسمى 
أتوماتة منتهية غير حتمية ) )Nondeterministic Finite Automata‏ و ما یطلق علیھا اختصاراً 
۸ وفي نفس الوقت يجب تطوير طريقة منظمة لتحويل أي أتوماتة منتهية غير حتمية إلى أتوماتة 
منتهية حتمية. وهذا ما سيتم دراسته في الجزء التالي . 

الأتومانة المنتهية غير الحتمية 


الآن وقبل التعرض للتعريف الرياضي للاتوماته المنتهية غير الحتمية نحتاج للقيام بتعميم خاص 
بالانتقالات يكون مفيداً في التعامل مع هذا النوع وهو مفهوم الانتقال الفارغ ( ١٠أ†أومه)-€)‏ الذي يتم 
دون استهلاك أي حرف من سلسلة حروف المدخلات كما لو كان يحدث تطابق مع سلسلة الحروف 
الفارغة التي نرمز لها بالرمز € ويظهر في مخطط الانتقالات كما يلي: 


قد يعتبر الانتقال الفارغ إلى حد ما غير بديهي لكونه يحدث بشكل عفوي ودون تحرك المؤشر أو حدوث 
تغيير في سلسلة حروف المدخلات ولكنه فعال جداً لسببين الأول آنه يمكن أن يعبر عن الاختيار بين 
البدائل بطريقة لا تحتاج إلى دمج حالات الاتوماته فمثلا عند الاختيار بين المفردات '==' و '=>'و '=' 
يمكن التعبير عن ذلك من خلال دمج الاتوماته الخاصة بكل منها كما يلي : 

حيث يتميز المخطط السابق انه قام بدمج الاتوماته الخاصة بكل مفردة دون إجراء أي تغير على أي 
منهم ودون دمج حالة البداية الخاصة بهم وإنما تمت إضافة حاله بداية جديدة لدمجهم معا . أما الميزة أو 
السبب الثاني لاستخدام الانتقال الفارغ كونه يمكن من وصف التطابق مع سلسلة الحروف الفارغة بشكل 


الحتمية التالية التي تعبر عن نفس الموقف ولكن بشكل غير واضح: 
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ا توسعة حروف الأبجدية ر لتشمل الحرف a‏ € ا نحتاج إلى إعادة تعريف دالة 
الانتقال 1 لتسمح عند حدوث التطابق مع أحد الحروف الانتقال لأكثر من حالة واحدة وذلك يتم بجعل 
ناتج هذه الدالة مجموعة حالات فمثلاً في المخطط التالي: 


نجد انه من الحالة ( 1 ) يمكن الانتقال لكل من الحالة ( 2 ) أو الحالة ( 3 ) مع حرف المدخلات '>' 
وهو ما نعبر عنه باستخدام دالة الانتقال 1 كما يلي : 


7(1, <) = {2,3 


وهو ما يعني ان ناتج هذه الدالة هو مجموعة حالات وبالتالي فإن مدى دالة الانتقال أصبح عبارة عن 
مجموعة المجموعات الجزئية للحالات والتي تسمى بمجموعة القوة (حع۲-5 مس٠۴‏ )) والتي تتكون من 
جميع المجموعات الجزئية ( ئامواں5) من مجموعة حالات الاتوماته حيث يرمز لمجموعة القوة 
لمجموعة الحالات $ بالرمز 5(i)م‏ ونقوم الان بتعريف الاتوماته المنتهية غير الحتمية )١N۴۸(‏ . 


من التعريف السابق يجب ملاحظة أن مجموعة الحالات المتتابعة 52 , 51 , 50 , , ١ك‏ التي يتم 
اختيارها من مجموعة الحالات ك۶ باستخدام دالة الانتقال 1 وسلسلة حروف المدخلات ليس من 
الضروري أن يتم تحديدها بشكل وحيد بل من الممكن أن يكون هناك أكثر من مجموعة من الحالات 
المتتابعة لنفس سلسلة حروف المدخلات ولهذا السبب يطلق على هذا النوع من الاتوماته لقب اتوماته 
غير حتمية فسلسلة الانتقالات التي تقبل سلسلة محددة من الحروف لايتم تحديدها في كل خطوة حسب 
الحالة الحالية وحرف المدخلات التالي بل من الممكن في أي وقت ظهور أي عدد من الحروف الفارغة 
€ ضمن سلسلة الحروف والذي يقابلها مجموعة من الانتقالات الفارغة في الأتوماتة المنتهية غير 
الحتمية ولهذا فإن الأتوماتة المنتهية غير الحتمية لا يمكن أن تمثل خوارزمية بالمعنى الصحيح ولكن 
يمكن أن نقول أنه يمكن محاكاتها باستخدام خوارزمية وهو ما سيتضح في الجزء التالي بينما نقدم الآن 
بعض الأمتلة الخاصة بالأتوماتة المنتهية الحتمية. 


متال 10 
بفرض المخطط التالي الخاص بإحدى الأتوماتة المنتهية غير الحتمية : 
فوفق] لهذا المخطط فإن سلسلة الحروف "ططه" يمكن قبولها بواسطة أي من سلسلتي الانتقالات التالية: 


حيث نلاحظ أن الانتقال من الحالة ( 1 ) إلى الحالة ( 2 ) يتم مع ظهور الحرف 'ه' بينما الانتقال من 
الحالة ( 2 ) إلى الحالة ( 4 ) يتم مع ظهور الحرف 'ط' مما يسمح من قبول سلسلة الحروف "طه" تم 
باستخدام الانتقال الفارغ من الحالة ( 4 ) إلى الحالة ( 2 ) يمكن قبول جميع سلاسل الحروف التي 
تتطابق مع التعبير المنتظم + طه وكذلك فإن الانتقال من الحالة ( 1 ) إلى الحالة ( 3 ) يتم مع ظهور 
الحرف 'ه' والانتقال من الحالة ( 3 ) إلى الحالة ( 4 ) يتم مع ظهور الحرف الفارغ € مما يمكن من 
قبول جميع سلاسل الحروف التي تتطابق مع التعبير المنتظم *طج وأخيراً فإن استخدام الانتقال الفارغ 
من الحالة ( 1 ) إلى الحالة ( 4 ) يسمح بقبول سلسلة الحروف التي تتطابق مع التعبير المنتظم*ط 
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وبالتالي فإن الأتوماتة المنتهية غير الحتمية السابقة يقبل نفس اللغة المقبولة بواسطة التعبير المنتظم +طج 
ا*ظ | *ظه | والذي يمكن تبسيطه ليصبح 


*a | €) B) 


وهو ما يمكن التعرف عليه باستخدام ال 0۴۸ التالية : 


مثال 11 
بفرض ال ۴۸" التالية : 
فإنه يقبل سلسلة الحروف "طهعءه" عن طريق سلسلة الانتقالات التالية ٠‏ 
وفي الحقيقة ليس من الصعب أن نلاحظ أن الأتوماتة المنتهية غير الحتمية السابقة تقبل نفس اللغة 
3 إعداد البرنامج الخاص بالأتوماتة المنتهية 

هناك عدة طرق لتحويل أيا من الأتوماتة المنتهية الحتمية أو الأتوماتة المنتهية غير الحتمية إلى 
برنامج مكتوب وسوف نستعرض تلك الطرق في هذا الجزء مع الأخذ في الاعتبار أن جميع الطرق 
ليست صالحة للاستخدام مع مرحلة تحليل المفردات لهذا سنركز في آخر جزئيين من هذه الوحدة على 
الطرق المناسبة لهذه المرحلة من المترجم بشيء من التفصيل والآن نعود إلى مثال الأتوماتة المنتهية 


الحتمية التي تقبل المعرفات التي تتكون من حرف أبجدي متبوع بسلسلة من الحروف الأبجدية أو 
الأرقام العشرية أو كلاهما والتي يأخذ مخطط الانتقالات الخاص به الشكل التالي: 


فإن أول وأسهل طريقة لمحاكاة هذه الأتوماتة المنتهية الحتمية هو كتابة البرنامج على الشكل التالي : 


{ starting in state 1 } 

if the next character is a letter then 

advance the input 

{ now in state 2 } 

while the next character is a letter or a digit do 
{ advance the input { stay in state 2 


end while 
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{ go to state 3 without advancing the input } 
accept 

else 

{ error or other cases } 


end if 


فالطريقة السابقة يتم فيها معالجة حالات الأتوماتة بشكل ضمني وليس صريحاً. وهذا ما يوضحه 
استخدام التعليقات لتحديد الحالة التي نقف عندها مع كل انتقال داخل الاتوماته وهذا مقبول إذا ما كان 
عدد الحالات صغير وإذا ما كان التكرار فى الأتوماتة المنتهية الحتمية محدد ولهذا فإن هذه الطريقة 
تكون مناسبة ويمكن استخدامها في كتابة الماسحات الصغيرة ولكن هناك عيبان أساسيان في هذه 
الطريقة الأول إن كل أتوماتة منتهية حتمية يتم التعامل معها بشكل مختلف وهو ما يجعل من الصعب 
إعداد خوارزمية عامة لتحويل أي أتوماتة حتمية إلى برنامج مكتوب باستخدام تلك الطريقة. أما العيب 
الثاني فيتمثل في أن تعقيد البرنامج سيزداد بشكل كبير مع زيادة عدد حالات الاتوماته وزيادة عدد 
الانتقالات بينها ولتأكيد ذلك بفرض الأتوماتة المنتهية الحتمية التي تم عرضها في المثال رقم (9) 
السابق والخاص بالتعرف على التعليقات المستخدمة في لغة السي والمطلوب إعداد البرنامج الخاص 
بهذه الاتوماته وسوف نترك للقارئ القيام بذلك وسيلاحظ مدى الزيادة في التعقيد في هذا البرنامج نتيجة 
للزيادة البسيطة في عدد الحالات والانتقالات وكبديل للطريقة السابقة هناك طريقة أخرى أفضل تقوم 
باستخدام احد المتغيرات لمتابعة الحالة الحالية مع تنفيذ الانتقالات من خلال اثنين من أوامر التفرع 
المتداخلة داخل الجزء الخاص بالتكرار حيث يقوم أمر التفرع الأول باختبار الحالة الحالية بينما يقوم 
أمر التفرع الثاني باختبار حرف المدخلات وعلى سبيل المثال فإن الأتوماتة المنتهية الحتمية السابقة 
الخاصة بالتعرف على المعرفات يمكن تحويلها إلى البرنامج التالي وفقا لهذه الطريقة الأخيرة : 


{ state: = 1 {start 

while state = 1 or 2 do 
case state of 

case input character of :1 
letter: advance the input 
state : = 2 


{ error or other } = : else state 
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end case 

case input character of : 2 
letter , digit : advance the input 
state : = 2 

else state : = 3 

end case 

end case 


end while 


if state = 3 then accept else error 


Compiler for msc of cs 


نلاحظ كيف أن البرنامج وفقا لهذه الطريقة يعكس الأتوماتة المنتهية الحتمية مباشرة ومع كل انتقال 
يتم تغيير قيمة المتغير مء برقم الحالة التي نصل عندها مع تقديم مؤشر المدخلات حرف للأمام 


سيزداد حجما ولكن لن يزداد تعقيداً مع زيادة عدد الحالات الخاصة بالأتوماتة المنتهية الحتمية نقوم الآن 
بإعداد البرنامج المقابل للأتوماتة المنتهية الحتمية التي تتعرف على التعليقات الخاصة بلغة السي والذي 


کون .كالانى: 

state: = 1 

while state = 1, 2, 3 or 4 do 
case state of 

case input character of : 1 
advance the input :"/" 

state := 2 

{ error or other} = : else state 


end case 
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case input character of : 2 
advance the input : " *" 

state := 3 

{ error or other } = : else state 
end case 

case input character of : 3 
advance the input :"*" 

state := 4 

{ else advance the input {stay in state 3 
end case 

case input character of : 4 

advance the input : "/" 

state := 5 

{advance the input {stay in state 4 : "*" 
else advance the input 

state : = 3 

end case 

end case 


end while 


if state = 5 then accept else error 


Compiler for msc of cs 
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بالإضافة للطريقتين السابقتين لإعداد البرنامج المقابل للأتوماتة المنتهية الحتمية توجد طريقة أخرى 
يتم فيها التعبير عن الاتوماته من خلال إحدى تراكيب البيانات التي يطلق عليها جدول الانتقالات 
(eاab‏ sitionرraآ)‏ ثم بعد ذلك يتم إعداد برنامج عام يتفاعل مع الجدول ويصلح لأي أتوماتة منتهية 
حتمية لان الذي يتغير فقط هو محتويات جدول الانتقالات الذي يأخذ شكل مصفوفة تنائية الأبعاد 
ومفهرسة بحالات وحروف مدخلات الأتوماتة المنتهية الحتمية حيث يعبر الجدول عن قيم دالة 
الانتقالات الخاصة بتلك الأتوماتة المنتهية الحتمية. فمثلا جدول الانتقالات التالى يمثل الأتوماتة المنتهية 
الحتمية التي تتعرف على المعرفات: 

وتتضمن خانات الجدول الانتقالات التي تظهر في ال 5۴۸ فقط أما باقي الخانات فتترك فارغة 
ونفترض أن أول حالة تظهر في الجدول هي دائما حالة البداية في ال 0۴۸ ولكن لا يوضح الجدول 
الحالات المقبولة وكذلك لا يحدد أي الانتقالات التي يصاحبها تحريك مؤشر حروف المدخلات وهذه 
التع مات كن ااا دون الاتقالات او ان نها تر ية اقات منفة قاذ افا :تاك 
المعلومات للجدول السابق فإنه يمكن إضافة عمود في النهاية يوضح ما إذا كانت كل حالة من الحالات 
التي يتضمنها الجدول أحد الحالات المقبولة واستخدام الأقواس للتعبير عن عدم تحريك مؤشر المدخلات 
فإن هذا الجدول سيصبح كما يلي: 
أما بالنسبة لل 0۴۸ الخاص بالتعرف على تعليقات لغة السي فإن جدول الانتقالات الخاص بها سيكون 
كما يلي : 


والآن نستطيع إعداد البرنامج العام القادر على التفاعل مع أي جدول انتقالات خاص بأي أتوماتة 
منتهية حتمية وذلك بفرض أن الانتقالات سيتم الاحتفاظ بها في جدول الانتقالات 1 وان يتم التعبير عن 
تحرك أو عدم تحرك مؤشر المدخلات بشكل منفصل من خلال المصفوفة المنطقية مc"‏ ج۸۷ 
المفهرسة أيضا بالحالات وحروف المدخلات اما الحالات المقبولة فسيتم تحديدها باستخدام المتجه 
المنطقي Accept‏ المفهرس بالحالات وفيما يلي خطوات هذ البرنامج العام: 
state: = 1‏ 
ch := next input character‏ 
while not Accept [ state ] do‏ 
[newstate : = T[state, ch‏ 
if Advance([state, ch] then‏ 
ch := next input character‏ 
state := newstate‏ 


end while 
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if Accept[ state ] then accept 


وهذه الطريقة الأخيرة تتميز بصغر حجم البرنامج وكذلك إمكانية استخدام نفس البرنامج مع العديد 
من الأتوماتة المنتهية الحتمية المختلفة ولكن تكمن المشكلة في زيادة حجم جدول الانتقالات مع زيادة 
عدد الحالات وحروف المدخلات التي تتضمنها الأتوماتة المنتهية الحتمية. 


وفي النهاية يجب توضيح أن الأتوماتة المنتهية غير الحتمية يمكن من إعداد البرنامج الخاص بها 
بنفس الطرق المستخدمة مع الأتوماتة المنتهية الحتمية ولكن لكون الأتوماتة المنتهية غير الحتمية غير 
حتميةء فإنه يوجد عدة سلاسل مختلفة من الانتقالات لا بد من اختبارها. لذلك فإن البرنامج الذي يحاكي 
الأتوماتة المنتهية غير الحتمية لا بد أن يسجل جميع الانتقالات الأخرى ولان ذلك يجعل من مثل هذه 
البرامج بطيئة وغير فعالة لهذا فبدلا من إعداد برنامج لتمتيل الأتوماتة المنتهية غير الحتمية فإنه من 
المفضل أن يتم تحويلها إلى أتوماتة منتهية حتمية وإعداد برنامج أكثر كفاءة وفعالية للأخيرة وهذا ما 
سوف نقدمه فى الجزء التالى. 
حول التعرر أك المتظة الى او اة نة اة 


في هذا الجزء سندرس كيفية تحويل التعبيرات المنتظمة إلى أتوماتة منتهية حتمية والعكس مما يعني 
أن الاثنان متماثلان ولكن بسبب أن التعبيرات المنتظمة مضغوطة وشديدة التركيز لذلك فنحن نفضل 
التعامل مع الاتوماته عن التعبيرات المنتظمة بينما بالنسبة للماسح الخاص بتحليل المفردات فإنه غالبا ما 
يبدأ بالتعامل مع التعبيرات المنتظمة قبل الشروع في بناء الاتوماته المنتهية الحتمية ولهذا السبب نهتم 
بالتحويل من التعبيرات المنتظمة إلى اتوماته منتهية حتمية وليس العكس واسهل طريقة لتحويل التعبير 
المنتظم إلى أتوماتة منتهية حتمية أن يتم ذلك من خلال مرحلة وسيطة وهذه المرحلة هي أتوماتة منتهية 
غير حتمية بمعنى أن نبدأ بتحويل التعبير المنتظم إلى أتوماتة منتهية غير حتمية ثم بعد ذلك يتم التحويل 
من أتوماتة منتهية غير حتمية إلى أتوماتة منتهية حتمية . وبالرغم من وجود طريقة تمكن من تحويل 
التعبير المنتظم إلى أتوماتة منتهية حتمية مباشرة» ولكن لشدة تعقيد هذه الطريقة فإنه يفضل استخدام 
الطريقة السابقة التي تتم على مرحلتين عند استخدام الطريقة المباشرة. وبعد الوصول إلى أتوماتة منتهية 
حتمية نقوم باستخدام الأسلوب الذي قدمناه في الجزء السابق لبناء البرنامج المقابل لتلك الاتوماته 
المنتهية ومن ذلك نستنتج أن الماسح الخاص بتحليل المفردات يتم بناءه على ثلاثة خطوات متعاقبة 
كالموضحة في الشكل التالي : 


4 التحویل من تعبیر منتظم إلى ۴۸× 
إن كل عملية من عمليات التعبير المنتظم يتم تحويلها بشكل منفصل إلى الأتوماتة المنتهية غير 
الحتمية المقابلة لها ثم بعد ذلك يتم تجميع تلك الأجزء المنفصلة من الأتوماتة المنتهية غير الحتمية 


الناتجة من التحويل ودمجها في أتوماتة منتهية حتمية واحدة باستخدام الانتقال الفارغ ويصبح الناتج هو 
الأتوماتة المنتهية غير الحتمية المجمعة التي تقابل التعبير المنتظم الأصلي. 


4 التعبيرات المنتظمة البسيطة 
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التعبيرات المنتظمة البسيطة تأخذ الشكل ج أو € أو @ حيث تمثل ال ۾ أحد حروف الأبجدية بينما تمثل 
ال € سلسلة الحروف الفارغة أما ال © فلا تمثل أي سلسلة حروف وفي حالة التعبير المنتظم الذي 
يتكون من حرف ال هج فإن ال ۴۸" التي تقابله تأخذ الشكل التالي : 


وبنفس الطريقة فإن ال ۴۸ المقابلة للتعبير المنتظم التي يتضمن الرمز € تكون كما يلي: 
242 الت ج 


عند بناء الأتوماتة المنتهية غير الحتمية التي تقابل التعبير المنتظم ءم حيث كل من ۲ و ء يمثلان تعبيران 
منتظمان في حد ذاتها وبفرض أن الأتوماتة المنتهية غير الحتمية الخاصة بكلاهما قد تم بناءهما ويأخذ 
كلاهما الشكلان التاليان 


وذلك بافتراض أن كلا منهما يتضمن على حالة مقبولة واحدة فعند ذلك فإن الأتوماتة المنتهية غير 
الحتمية المقابلة للتعبير المنتظم ء٣‏ ستكون كالتالي: 

حيث تم توصيل الحالة المقبولة للأتوماتة المنتهية غير الحتمية المقابلة للتعبير المنتظم ۲ مع حالة 
البداية الخاصة بال الأتوماتة المنتهية غير الحتمية المقابلة للتعبير المنتظم ء باستخدام الانتقال الفارغ 
وأصبحت حالة البداية الخاصة بالأتوماتة المنتهية غير الحتمية الأولى هى حالة البداية للأتوماتة المنتهية 
غر الحتة الحهة ته 0۴ اة ا اة اة غر الحتة اة فا صخت هي الخالة 
المقرلة اللات مانة المتثهية غير الختمية المجفحة: 


4 الاختيار بين البدائل 


لبناء الأتوماتة المنتهية غير الحتمية تقابل التعبير المنتظم ء | ٣‏ وتحت نفس الفروض السابقة فإنها 
ستکون كما يلي : 


حيث تمت إضافة حالة بداية جديدة وحالة مقبولة جديدة للأتوماتة المنتهية غير الحتمية المجمعة وتم 
توصيلهما بالأتوماتة المنتهية غير الحتمية الأولى والثانية باستخدام الانتقالات الفارغة كما هو موضح 
في الشكل السابق. 


4 التكرار 


عند بناء الأتوماتة المنتهية غير الحتمية تقابل التعبير المنتظم*, ووفقا للفروض السابقة فإنها ستأخذ 
الشكل التالي : 

حيث تم هنا أيضا إضافة حالة بداية وحالة مقبولة جديدان للأتوماتة المنتهية غير الحتمية المدمجة 
وتوصيلهما مع الأتوماتة المنتهية غير الحتمية الأولى المقابلة للتعبير المنتظم ٣‏ باستخدام الانتقالات 
الفارغة وكذلك تم توصيل حالتي البداية في كلاهما مع حالتي القبول كما هو موضح بالشكل لتمتيل 
عملية التكرار. 
والآن وبعد الانتهاء من جميع عمليات التعبيرات المنتظمة و معرفة كيفية تحويلها إلى الأتوماتة المنتهية 
غير الحتمية يجب الإشارة إلى أن الأتوماتة المنتهية غير الحتمية الناتجة من التحويل يمكن تبسيطها في 
بعض الأحوال وهذا ما ستوضحه الأمثلة التالية: 
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مثال 12 


لتحويل التعبير المنتظم ج | طه إلى الأتوماتة المنتهية غير الحتمية وفقا لطريقة التحويل السابقة سنبداً 
ببناء الأتوماتة المنتهية غير الحتمية المقابلة لكل من التعبيرين المنتظمين ج و ط واللذان سيأخذان الشكل 
التالي: 

وبالتالي فإن الأتوماتة المنتهية غير الحتمية التي تقابل التعبير المنتظم طج ستكون كما يلي : 

لنصل في النهاية للأتوماتة غير الحتمية المقابلة للتعبير المنتظم الأساسي ۸ | طه والذي سيأخذ الشكل 
التالي: 


مثال 13 


التعبير المنتظم i*(ااعاك‏ | ۲عا۲ء|ا) هt†ه|‏ الذي يمثل المعرفات يمكن بناء ال الأتوماتة المنتهية غير 
الحتمية المقابل له باستخدام نفس الأسلوب السابق بان نبداً في البداية إعداد ال الأتوماتة المنتهية غير 


الحتمية الذي تقابل كلا من التعبيرين المنتظمين اعا , |٤٥٣‏ كما يلي: 


ثم نقوم ببناء الأتوماتة المنتهية غير الحتمية المقابلة للتعبير المنتظم أعال | ٣هه|‏ كما في الشكل 
الاتي: 


وبعد ذلك نقوم ببناء الأتوماتة غير الحتمية التي تقابل التعبير المنتظم *(أعال | ٣٥ا†ه|)‏ كالتالي: 


لنصل في النهاية إلى الأتوماتة المنتهية غير الحتمية المقابلة للتعبير المنتظم الأساسي *( | ٣ع†ام|‏ 
|ett er) dig‏ والتي ستأخذ الشكل الآتي: 


تقلیل عدد حالات ال 5۴۸ 


إن الطريقة السابقة الخاصة بتحويل التعبير المنتظم إلى أتوماتة منتهية حتمية قد يعاب عليها أنها تقدم 
أتوماتة منتهية حتمية معقدة إلى حد ما أكثر من اللازم فمتلا في المثال(10 ) وصالنا إلى الأتوماتة 


1 2 ية 1 . ية التالية التي تقابل ا بد 1 a* PE‏ : 


في حين أن الأتوماتة المنتهية الحتمية الآتية يمكن أن تقوم بنفس الدور : 


على الرغم من كونها تتكون من عدد حالات أقل وحيث أن كفاءة ال 0۴۸ المستخدم في الماسح الخاص 
بمحلل المفردات يعد من الأمور الهامة لذلك فإنه من المفضل إنشاء الأتوماتة المنتهية الحتمية التى 
تحتوي على أقل عدد من الحالات وفي الحقيقة وكنتيجة هامة من نظرية الأتوماتة فإن أي أتوماتة منتهية 
خثمية بقايلها انو مان منتهية حثفبة ورخدة كرون من الك الأئنى من عد الحالات و هناك أيضا طريةة 
مباشرة لإيجاد هذه الأتوماتة المنتهية الحتمية عالية الكفاءة من أي أتوماتة منتهية حتمية. وهذه الطريقة 
تبداً بأكثر الفروض مثالية حيث يتم إنشاء مجموعتين من الحالات الأولى تتضمن جميع الحالات المقبولة 
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في الأتوماتة المنتهية الحتميةء بينما تتضمن الثانية باقي الحالات. ثم يتم متابعة جميع الانتقالات الناتجة 
عن كل حرف من حروف الأبجدية فإذا فإذا کان لدى جميع الحالات المقبولة إنتقال نتيجة للحرف ج إلى 
بعض الحالات المقبولة فإنه يتم إنشاء حالة مقبولة موحدة تشمل مجموعة الحالات المقبولة السابقة 
تتضمن على إنتقال نتيجة للحرف ج منها إلى نفسها وبنفس الأسلوب إذا كان لدى جميع الحالات المقبولة 
نتيجة للحرف جه انتقال إلى حالات غير مقبولة فإنه يتم إنشاء حالة مقبولة موحدة تتضمن انتقال نتيجة 
للحرف ج إلى الحالة غير مقبولة المجمعة التي تشمل مجموعة الحالات غير مقبولة السابقة ولكن في 
نفس الوقت إذا كان هناك لأي حالتين من حالات القبول يوجد إنتقالات نتيجة لنفس الحرف إلى 
مجموعتين مختلفتين من الحالات أو يوجد لأحدهما إنتقال ولا يوجد لآخر فإنه لا يمكن إنشاء إنتقال 
موحد لتجميع تلك الحالتين في مجموعة واحدة للحالات المقبولة بل على العكس يجب تقسيم مجموعة 
الحالات المقبولة إلى عدة مجموعات على حسب حالة الوصول التي يؤدي إليها الإنتقال الناتج عن هذا 
الحرف ونفس الوضع أيضا ينطبق على أي مجموعة من الحالات فإنه لابد من إعادة الخطوات من 
البداية ونستمر على ذلك التقسيم لمجموعة حالات الأتوماتة المنتهية الحتمية الأصلية إلى أن نصل إلى 
وضع لا يمكن معه التقسيم عند ذلك نكون قد وصالنا إلى الأتوماتة المنتهية الحتمية التي تحتوي على 
الحد الأدنى من عدد الحالات وسوف نوضح أكثر طريقة الوصول إلى تلك الأتوماتة المنتهية الحتمية 
باستخدام المثالين التاليين: 


مثال 18: 


بفرض الأتوماتة المنتهية الحتمية التي وصانا لها في المثال السابق والخاصة بالمفردات فإنها تتكون من 
أربعة حالات أحدها هي حالة البداية والحالات الثلاثة الباقية هي حالات مقبولة وجميع الحالات المقبولة 


لديها إنتقالات إلى حالات مقبولة أخرى نتيجة لكل من الحرف letter‏ أو اعا ولايوجد اي إنتقال آخر 
غير ذلك. ولهذا فانه یمکن تجميع مجمو عة الحالات المقبولة في حالة مقبولة واحدة إلى الأتوماتة 
المنتهية الحتمية التي تحتوي على الحد الأدنى من الحالات والتي تأخذ الشكل التالي: 


مثال (19) : 


بفرض الأتوماتة المنتهية الحتمية والتي تقابل التعبير المنتظم *طء( = | ج ) 

ففي هذا المثال نجد أن جميع الحالات هي حالات مقبولة وكذلك نلاحظ وجود إنتقال لدى جميع تلك 
الحالات نتيجة للحرف ط يصل إلى حالات مقبولة ممايشير إلى إمكانية تجميع مجموعة الحالات المقبولة 
في حالة مقبولة موحدة ولكن لكون حرف ال ج يفرق بينهم حيث يوجد فقط لدى الحالة (1) إنتقال نتيجة 
NN N EEO SOP EEE aa‏ 
للحالات المقبولة إلى مجموعتين منفصلتين تشمل الأولى الحالة (1) فقط على أن تتضمن الحالتين (2) و 
(3) في مجموعة واحدة يمتلها حالة مقبولة موحدة في الأتوماتة المنتهية الحتمية المحسنة لتصبح تلك 
الأتوماتة المنتهية الحتمية التي تحتوي على الحد الأدنى من الحالات كما يلي: 

. إنشاء محلل المفردات الخاص باللغة الإفتراضية 


نريد في هذا الجزء إعداد البرنامج الخاص بمحلل المفردات الذي يعكس المفاهيم التي تمت دراستها 


في هذه الوحدة وسيتم ذلك بالنسبة للغة الإفتراضية السابق الإشارة إليها في الوحدة الأولى ونستطيع الآن 
مناقشة عدد من الموضو عات التطبيقية المتعلقة بهذا الجزء من المترجم. 
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في الوحدة الاولى تم فقط إعطاء بعض المعلومات البسيطة عن اللغة الإفتراضية ومهمتنا هنا أن نقوم 
بتحديد الهيكل المفرداتي الخاص بتلك اللغة بشكل كامل عن طريق تعريف مفرداتها والخصائص 
المرتبطة بها والجدول التالي يلخص مفردات اللغة الإفتراضية مع تصنيفها وفقا للأنواع الأساسية: 

حیٿ تم تقسیم مفردات اللغة إلى ثلاثة مجمو عات وهناك تمانية كلمات محجوزة لها معنى واضح 
ومتعارف عليه بالإضافة إلى عشرة رموز خاصة تشمل العمليات الحسابية الأربعة الأساسية التي يتم 
إجراءها على الأعداد الصحيحة وكذلك إثنان فقط من عمليات المقارنة هما علامة التساوي وعلامة 
الأقل من وأيضا الأقواس والفاصلة المنقوطة وعلامة التخصيص ويلاحظ أن جميع الرموز الخاصة 


التي تتكون من سلسلة من واحد أو أكثر من الأرقام العشرية وأيضا المعرفات التي تتكون من أجل 
التبسيط من سلسلة من حرف واحد أو أكثر من الحروف الأبجدية فقط. 


وبالإضافة إلى المفردات تتضمن اللغة التعليقات التي يتم وضعها بين الأقواس ([)) ويوجد حرية 
في شكل البرنامج المكتوب بهذه اللغة بإضافة أي من المسافات البيضاء التي تشمل المسافات المفردة 
والمسافات المتعددة وأيضا رمز السطر الجديد. 


ولتصميم ماسح لهذه اللغة فالمفترض أن نبدأ بالتعبيرات المنتظمة ثم بعد ذلك نقوم بإعداد الأتوماتة 
المنتهية غير الحتمية الأتوماتة المنتهية الحتمية المقابلة لها وفقا للطريقة التي تم شرحها في الجزء 
السابق وقد تم بالفعل عرض التعبيرات المنتظمة الخاصة بالأعداد و المعرفات وأيضا التعليقات ولكن 
اللغة الأفتراضية التى نحن بصددها تكون نسخة التعبيرات المنتظمة الخاصة بها أكثر بساطة أما 
التعبيرات المنتظمة الخاصة بباقي المفردات فإنها في غاية السهولة لأن كلها تتكون من سلسلة حروف 
ثابتة لهذا فبدلا من المرور بالطريق الخاص بالتحويل وحتى الوصول إلى أتوماتة منتهية حتمية سنقوم 
بإعداد ال 0۴۸ مباشرة» حيث سيتم ذلك في عدة خطوات وسنبدأً بالرموز الخاصة والتي تتكون كلها 


كالتالي 


ففي المخطط السابق ستقوم الحالات المقبولة المختلفة بالتفرقة بين المفردات التي سيتم تحديدها بواسطة 
الماسح وفي حالة استخدام متغير واحد في البرنامج لتحديد المفردة التي تم التعرف عليها فإنه يمكن 
تجميع الحالات المقبولة المختلفة السابقة في حالة مقبولة واحدة كما يمكن عند ذلك إضافة الجزء الخاص 
بقبول الأعداد والمعرفات إلى الأتوماتة المنتهية الحتمية لتصبح كما يلي: 

ويمكن أيضا إضافة التعليقات والمسافات البيضاء وعلامة التخصيص للأتوماتة المنتهية الحتمية لتصبح 
كما يلي: 


ولم يتم تضمين الكلمات المحجوزة في ال أتوماتة منتهية حتمية السابقة لأن ذلك هو أسهل أسلوب 
للتعامل مع تلك الكلمات حيث سيفترض أنها مثل المعرفات وبعد هذا يتم الكشف عنهم في جدول الكلمات 
المحجوزة بعد قبول هذه المعرفات وهو ما سبق شرحه من قبل عند عرض كيفيه إستخدام جداول 
الرموز اثناء تحليل المفردات. 


وبصفة عامة يحتاج الماسح أيضا إلى تحديد الخصائص الخاصة بالمفردات في حالة وجودها وفي 
بعض الأحيان أيضا يتم تنفيذ بعض الإجراءات الأخرى مثل إضافة المعرفات إلى جدول الرموز 
وبالنسبة للغة الإفتراضية فإن الخاصية التي يتم تحديدها هي سلسلة الحروف التي تكون المفردة التي تم 
EE‏ 
تحليل الصيغ النحوية 
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Syntax Analysis 
إن مهمة هذه المرحلة من مراحل المترجم التي تسمى أيضا بمرحلة الإعراب (ع”أئة٥) هي تحديد‎ 
الصيغ النحوية الخاصة بهيكل البرنامج المراد ترجمته حيث يتم تمثيل الصيغ النحوية الخاصة بلغة‎ 
Co"†ع×†‎ 8 ( البرمجة في شكل قواعد نحوية (sعاuںR ة٣ صهاي) من القواعد النحوية الخالية السياق‎ 
بطريقة مشابهة للطريقة المستخدمة في هيكلة المفردات التي يتم تمییز ها أثناء‎ ( free Grammar 
. (Regular-free Expression) ةمظتiم مرحلة تحليل المفردات و التي يتم تمتيلها في شكل تعبيرات‎ 
وعلى الرغم من أن القواعد النحوية الخالية السياق ( التي تم شرحها في الوحدة الثانية ) تستخدم تسميات‎ 
وعمليات مشابهة لمثيلتها في التعبيرات المنتظمة ولكن الفرق الأساسي بينهما في كون القواعد النحوية‎ 
كما أوضحنا في الوحدة الثانية من‎ (Recursive ) الخالية السياق تسمح بالقواعد التي تستخدم التكرار‎ 
هذه المادة العلمية فعلى سبيل المثال هيكل أمر ۴¡ يسمح بوجود عدة أوامر ۴¡ متفرعة منها وهذا التكرار‎ 
غير مسموح به في التعبيرات المنتظمة وبالإضافة إلى هذا الفرق فإن الخوارزميات المستخدمة في‎ 
التعرف على تلك الهياكل البرمجية تختلف أيضا عن خوارزميات تحليل المفردات في كونها تستخدم‎ 
التكرار وتراكيب البيانات المستخدمة في تمثيل الهياكل النحوية للغة يجب أيضا أن تكون تكرارية‎ 
وليست خطية كما في حالة تمثيل المفردات. وعموما فإن تركيبة البيانات الأساسية في هذه المرحلة هي‎ 


کل لن الاکار ي کر عر ات او رواک 
. عملية الإإعراب 


إن تحديد الهيكل النحوي للبرنامج من المفردات التي يتم إنتاجها بواسطة محلل المفردات وما يتبعها 
من إنشاء شجرة الإعراب أو شجرة النحو التى تمتثل ذلك الهيكل هو المهمة الأساسية لمرحلة تحليل 
الصيغ النحوية أو ما تسمى بمرحلة الإعراب كما ذكرنا سابقا. ولهذا فإن عملية الإعراب يمكن أن نراها 
كوظيفة ( ٣ها†عءمں۴‏ ) تأخذ المدخلات المتتابعة من المفردات التي تم توليدها بواسطة محلل المفردات 
لتقدم كمخرجات شجرة النحو وغالبا لا يتم إعطاء متتابعة المفردات لتلك الوظيفة بشكل مباشر ولكنها 
تستدعى الوظيفة الخاصة بتحليل المفردات لتطلب المفردة التالية عند الاحتياج إليها وليس قبل ذلك وفي 
حالة المترجمات التي تتم كمرحلة 8 sئaم‏ 8 ع0"n)‏ والتي سبق شرحها في 
الوحدة الثالثة فإن مرحلة الإعراب تتضمن جميع المراحل الأخرى للمترجم بما فيها توليد الشفرة 
المستهدفة من الترجمة ولهذا لا نحتاج لإنشاء شجرة النحو فعليا وذلك لكون خطوات عملية الإعراب 
نفسها تمثل شجرة النحو بشكل ضمني كما سبق وأوضحنا ولكن هذا النوع من المترجمات قليل جدا 
وأغلب المترجمات تتكون من عدة مراحل وفي هذه الحالة فإن شجرة النحو يتم إنشاءها فعليا لأنها 
تستخح كمدخلات لمر احل القالة من :الت رخ 


ويرتبط هيكل شجرة النحو بشكل كبير بالهيكل النحوي للغة البرمجة وهذه الشجرة دائما ما يتم تعريفها 
كتركيبة بياناٽ nتحركة‏ ) Dynamic Data Structure‏ ) بحيث تتكون كل عقدة داخلها من سجل ( 
عع ۴ ) يتكون من عدة حقول ( ءل ام۴ ) تتضمن عناصر البيانات المطلوبة خلال مراحل الترجمة 
التالية. 


رأ لفاك الاك رة بامهة رخ راب مقار ية يل المردات ن هة 
معالجة الأخطاء في حالة محلل المفردات وعند اكتشاف أحد الحروف الذي لا ينتمي لأي من مفردات 
اللغة فإنه يقوم بإظهار رسالة تفيد وجود خطأ ثم يتخطى هذا الحرف لاستكمال مهمته بينما في حالة 
حدوث ذلك في مرحلة الإعراب فإن الأمر يتطلب ليس فقط إظهار تقرير بالخطأً ولكن أيضا لا بد من 
الاستعفاء من هذا الخطاً حتى يتمكن من متابعة الإعراب ليظهر في النهاية قائمة بجميع الأخطاء التي 
وجدت. وفي بعض الأحيان يقترح تصحيحا لهذه الأخطاء أو يقدم برنامجا خاليا من الأخطاء ولكن هذا 


83 


جامعة النيلين - كلية العلوم/ مدرسة العلوم الرياضية- إعداد / عمر إبراهيم عبدالله Compiler for msc of cs‏ 


يحدث في الحالات البسيطة والأمر الهام من الناحية التطبيقية بخصوص الاستعفاء من الأخطاء هو أن 
تكون رسالة الخطا مفهومة وأقرب ما تكون من الخطأ الفعلي بقدر الإمكان وهذا ليس بالأمر السهل 
ونظرا لأهمية ذلك فسيتم عرضه بشكل منفصل في الجزء الأخير من هذه الوحدة. 

. الإعراب من أعلى إلى أسفل 


في طريقة الإعراب من أعلى إلى اأسفل ) Top El down Parsing‏ ( يتم إعراب سلسلة المفردات 

بتتبع الخطوات الخاصة بالاشتقاق من أقصى اليسار وقد سميت هذه الطريقة بهذا الاسم لكونها تقوم 

اتل داخل شجرة الإعراب أو شجرة النحو بدءا من جذر الشجرة وحتى أوراقها وذلك على اعتبار أن 
جذر الشجرة كأحد تراكيب البيانات يكون لأعلى بينما أوراق الشجرة تكرن لأسفل. 


والإعراب من أعلى لأسفل يتم بأحد شكلين: 
1. الإعراب lاlترlجعي gy (Backtracking Parsing)‏ 
2. الإعراب التنبjؤي‏ ) Predictive Parsing‏ ( 


وفي الإعراب التنبؤي يتم التنبؤ بالتركيبة التالية في سلسلة المدخلات عن طريق استخدام واحد أو 
أكثر من المؤشرات الأمامية ( 0١2عة)هه|‏ ) لتتمكن من التعرف على المفردات التالية مقدما بينما في 
الإعراب التراجعي يتم تجربة الاحتمالات المختلفة لإعراب المدخلات حيث تتراجع عند الفشل في أي 
احتمال لتجربة باقي الاحتمالات لحين الوصول إلى الاحتمال السليم وهذا الشكل الأخير من الإعراب 
يكون فعَالا ولكنه بطئ ولذلك فهو غير مناسب من الناحية العملية ولن نقوم بدراسته في هذه المادة 
العلمية وسيقتصر عرضنا فقط على أسلوب الإعراب التنبؤي حيث سندرس طريقتين من طرق الإعراب 
من أعلى لأسفل كلاهما يستخدم أسلوب الإعراب التنبؤي. الطريقة الأولى تسمى بالإعراب التنازلي 
التكراري ) Recursive ¶ Descent Parsing‏ ) والثانية تسمى طريقة الإعراب ا(1) ا1 وطريقة 
الإعراب التنازلي التكراري تعتبر طريقة مناسبة لإنشاء وحدة الإعراب الذي يتم إعدادها يدوي وسوف 
يتم عرضه في الجزء القادم على أن يتم دراسة طريقة الإعراب ا(1) ا1 في الجزء الذي يليه وعلى 
الرغم من صعوبة تطبيق هذه الطريقة الأخيرة من الناحية العملية إلا أنه من المناسب دراستها كنموذج 
لاستخدام المكدسات (ء)عه†5) في الإعراب كما أنها تساعد في صياغة بعض المشاكل الموجودة في 
الطريقة الأولى وعموما فإن تسمية هذه الطريقة ب )1(i‏ ا[ لكونها اختصارا يعنى فيه حرف "ا" الأول 
أن معالجة المدخلات تتم من اليسار (۴1٠1ا)‏ إلى اليمين وذلك لكون بعض طرق الإعراب القديمة كان 
يتم فيها معالجة المدخلات من اليمن إلى اليسار و حرف "ا" الثاني فإنه يشير إلى أنها تقوم بتتبع 
خطوات الاشتقاق من أقصى اليسار ( Left ¶ most Derva ti0"‏ ) لسلسلة المدخلات أما الرقم "1" 
الذي بين الأقواس فانه یعنی أنه یستخدم مفردة واحدة من المدخلات للتنبؤ باتجاه الإعراب السليم وهناك 
طرق إعراب تنبؤية أخرى تستخدم عدة مفردات للتنبؤ باتجاه الإعراب السليم. 
. الإعراب التنازلي التكراري 


إن الفكرة الخاصة بالإعراب التنازلي التكراري فكرة بسيطة كونه يرى القاعدة النحوية للرمز 
اللاتهائي ۸ كتعريف للإجراء الذي سيتعرف على ۸ حيث يحذد الطرف الأيمن لتلك القاعدة النحوية 
هيكل الخطوات الخاصة بهذا الإجراء فالرموز النهائية يقابلها تطابق مع المدخلات والزموؤز اللانهائية 
يقابلها استدعاء لإجراءات أخرى. أما البدائل فيقابلها أحد أوامر الاختيار متل ¡f‏ أو مجع ولتوضيح ذلك 
بفرض القواعد النحوية التالية الخاصة بالتعبيرات ( كمه‌أووم۲م×ع ) الرياضية: 
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<exp> <exp> <addop> <term> | <term> 

- | + <addop> 

<term> <term> <mulop> <factor> | <factor> 
* <mulop> 


factor> (<exp>) | number> 


فإن الإجراء التنازلي التكراري الذي يتعرف على الرمز اللانهائي <۲ه†عهf>‏ يمكن أن يكون كما يلي: 
procedure factor‏ 

begin 

case lookahead of 

('(') match ('('); exp ; match : ')' 

('number' : match ('number' 

else error 

end case 

end factor 

وفي هذا الإجراء السابق نفترض أن المتغير ٥ة‏ )هه| يحتفظ بالمفردة القادمة في المدخلات وأن 
الإجراء ةم يقوم بمطابقة تلك المفردة مع المعطيات على أن يتم تقديم مؤشر المدخلات إذا حدث 
ذلك التطابق أو يظهر رسالة خطأ إذا لم يحدث ذلك وبالتالي فإن هيكل الإجراء ٤ة"‏ سيكون كما 
يلي: 

( procedure match (t : token 

begin 


if lookahead = t then 
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lookahead: = next token 

else 

error 

end match 

وبالطبع عند استدعاء الإجراء طعاةم مع كل من المفردة ')' والمفردة '٣٥eطاہںہ'‏ لا بد أن يحدث 
التطابق بين لكةعه)هه| وبين † ولكن ذلك ليس بضروري حدوته في حالة استدعائه مع المفردة '(' 
ولهذا كان من الضروري اختبار ذلك داخل الإجراء جص . 


وبالرغم من سهولة إعداد الإجراء التنازلي التكراري للرمز اللانهائي مه۴ كما شاهدناء ألا أن الأمر 


ليس كذلك بالنسبة لباقي القواعد النحوية الخاصة بالتعبير الرياضي. ويستلزم الأمر إدخال بعض 
التغييرات عليها حتى يمكنا إعداد الإجراء التنازلي التكراري الذي يمثلها. وهذا ما سيتم ولكن قبل هذا 
نفترض كمال آخر القاعدة النحوية المبسطة لأمر ¡f‏ : 
<if El stmt > if ( <exp> ) <stmt >‏ 
<if ( <exp> ) <stmt> else <stmt |‏ 
والتي يمكن إعداد الإجراء التنازلي التكراري الخاص بها ليكون كما يلي: 
procedure ifstmt‏ 
begin‏ 
(match ("if‏ ; 
match‏ )')( ; 
exp‏ , 
match‏ )')( ; 
stmt‏ ,; 


if lookahead = 'else' then 


; (match ( 'else 
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;, stmt 
end if 


end ifstmt 


ففي هذا المثال لا نستطيع أن نفرق مباشرة بين الاختيارين الموجودين في الجانب الأيمن من القاعدة 
عند إدراك الجزء الاختياري عءام بظهور المفردة 'مء|ء' في المدخلات. 


3 استخدام شکل 8۴ع في تمثیل الاختیار والتکرار 


في المتال السابق الخاص بأمر ۴¡ نجد أن الإجراء التنازلي التكراري قد قام فعليا بتمثيل القاعدة النحوية 
التالية التي تستخدم شكل باكوس نور الموسع : 


[x<if FM stmt > if (<exp>) <stmt> [ else <stmt > 


وليس الشكل الأصلي لباكوس نور حيث تم استخدام الأقواس [ ] الخاصة بشكل باكوس نور الموسع 
للتعبير عن الجزء الاختياري في امر ۴¡ وهو ما تم تمثيله في الإجراء التنازلي التكراري من خلال 
الاختبار. وفي الحقيقة فإن شكل باكوس نور الموسع قد تم تصميمه ليعكس بقدر الإمكان الخطوات 
الفعلية للإعراب التنازلي التكراري. ولهذا فإن القواعد النحوية لا بد من إعدادها بواسطة هذا الشكل في 


حالة استخدام الإعراب التنازلي التكراري. ويجب أيضا ملاحظة أن القاعدة النحوية السابقة تحتوي على 
بعض الغموض كما أوضحنا ذلك في الوحدة الثانية لهذا فإنه من الطبيعي إعداد وحدة الإعراب التي تقوم 


غير الغامضة الخاصة بحالة التداخل في أمر ۴¡ . 
والآن نعود إلى القواعد النحوية الخاصة بالتعبير الرياضي المبسط وبفرض القاعدة النحوية التالية 
الخاصة بالرمز اللانهائي <م×ع> والمكتوبة باستخدام شكل باكوس نور: 


<exp> <exp> <addop> <term> | <term> 


فإذا حاولنا إعداد الإجراء التنازلي التكراري الخاص بهذا الرمز اللانهائي <م×ه> وفقةا للتمثيل المباشر 
للقاعدة النحوية السابقة فإن أول خطوة فى هذا الإجراء ستكون استدعاء الإجراء لنفسه وهو ما يؤدى 
ا و کو غه ا ا اا 
بالتكرار من ناحية اليسار ولكننا الآن ولحل هذه المشكلة وبدلا من تحويل التكرار ليكون من ناحية 
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اليمين كما فعلنا سابقاء فإنه يمكن إعادة كتابة القاعدة السابقة باستخدام شكل باكوس نور الموسع والتي 
ستحل تلك المشكلة وستصبح كما يلي: 


{ <exp> <term> { <addop> <term> 


مع الأخذ في الاعتبار بأن الأقواس  [‏ في شكل باكوس نور الموسع يتم تمثيلها من خلال أحد الأوامر 
التكرارية مثل أمر ءانس وهذا ما يتضح في الإجراء التنازلي التكراري التالي الخاص بالرمز 
<م×ه> اللانهائي: 

procedure exp 

begin 

,;term 

while lookahead = '+' or lookahead = '-' do 

; (match (lookahead 

term 

end while 

end exp 

وبنفس الطريقة فإن القاعدة النحوية الخاصة بالرمز اللانهائي < >٠‏ عند إعادة كتابتها باستخدام 
شكل باكوس نور الموسع ستكون كما يلي: 

{ <term> < factor > {<mulop> < factor> 


procedure term 
begin 
; factor 
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while lookahead = '*' do 

; (match (lookahead 

factor 

end while 

end term 

وقد تم في الإجراءين الخاصين بالرمزين <م×ع> و <۲> اللانهائيين تجاوز أعداد إجراء مستقل 
للرمزين < مهل لهة> و <مهاuاص>‏ حيث أنهما مجرد خطوة تطابق مع العمليات الرياضية الأساسية 
وتم الاكتفاء بالقيام بهذا التطابق مباشرة كما رأينا في الإجراءين السابقين. 

والسؤال الذي يطرح نفسه الآن هل الاتحاد من ناحية اليسار والذي يظهر واضحا في القاعدة النحوية 
المكتوبة باستخدام شكل باكوس نور ما زال موجوداً في مثيلتها المكتوبة باستخدام شكل باكوس نور 
الموسع؟ فإذا فرض على سبيل المثال أننا نريد إعداد آلة حاسبة باستخدام طريقة الإعراب التنازلي 
التكراري تطبق القواعد النحوية الخاصة بالتعبير الرياضي بشكله المبسط الذي تم عرضها في هذا 


الجزء ونستطيع التأكد من اتحاد العمليات من ناحية اليسار عن طريق تنفيذ تلك العمليات داخل أمر 
التكرار وهو ما يتضح بفرض تحويل الإجراءات الخاصة بالإعراب التنازلي التكراري إلى وظائف 


برمجية ترجع أعداداً صحيحة فمتلاً الوظيفة التي تمتل الرمز اللانهائي <م×ه> ستكون كما يلي: 


function exp: integer 

var temp: integer 

begin 

, temp := term 

while lookahead = '+' or lookahead = '-' do 
case lookahead of 

; (“+') match : '+' 

, temp := temp + term 

; (-") match :'- 
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, temp := term Bl term 
end case 
end while 


end exp 


Compiler for msc of cs 


وبنفس الطريقة يتم إعداد الوظائف الخاصة بباقي الرموز اللانهائية وقد تم استخدام تلك الفكرة في إنشاء 


آلة حاسبة بسيطة بلغة السي والبرنامج الكامل التالي يقدم تلك الآلة الحاسبة: 


<include <stdio.h # 
<include <stdbb.h # 


/* char token ; /* global variable 


/* function prototypes far recursive calls */ 


; (int exp (void 

; (int term (void 

; (int factor (void 

(void error (void 

; ("fprintf (stderr , "Error\n 
; (exit (1 

{ 


(void match ( char expectedToken 


} 


( if (token = = expectedToken 
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;, token = getchar 


else error 


main 


; int result 

; token = getchar 

; result = exp 

( "if (token = = '\n 

;(printf ( "Result = %d \n", result 
, else error 

,return O 

{ 

( int exp ( void 

} 

;, int temp = term 

((-' = = while (( token = ='+') | | (token 
} ( switch ( token 

; (+' ) case '+': match 

, temp + = term 


; break 


Compiler for msc of cs 
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; (-" ) case '-': match 
, temp - = term 
;break 


{ 


, return temp 

{ 

( int term ( void 

, int temp = factor 

} (*' = = while ( token 
} (*' ) match 

, temp * = factor 

{ 


, return temp 


{ 


( int factor ( void 


1 

; int temp 

} ()' = = if (token 
; ()) match 


, temp = exp 


Compiler for msc of cs 
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match‏ )(( ; 

{ 

} (( else if ( isdigit ( token 

; (ungetc ( token , stdin 

; ( scanf ("%d" , &temp 


; token = getchar 


{ 


; else error 


, return temp 


{ 


إن هذه الطريقة لتحويل القواعد النحوية المكتوبة باستخدام شكل باكوس نور الموسع إلى إجراءات أو 
وظائف برمجية ذات كفاءة عالية ولكنها تتطلب قدراً كبيرآ من الاهتمام بترتيب خطوات كل إجراء أو 
وظيفة وفق قاعدة عامة لا بد أن يقف المؤشر الذي يمثله المتغير ١2عة)هه|‏ عند أول مفردة قبل البدء 
في عملية الإعراب ولا يتم طلب مفردة جديدة إلا بعد اختبار المفردة الحالية وهو ما يتم داخل الإجراء 
غمص في العرض السابق وهذا الاهتمام بجدولة الأحداث يحدث أيضا أثناء بناء شجرة النحو حيث لا 
بد من بناء الشجرة والعقد التي تتكون منها بترتيب وتسلسل محدد وفقا لترتيب ظهور المفردات في 
المدخلات 


وعموما فإن أسلوب الإعراب التنازلي التكراري الذي عرضناه في هذا الجزء يتميز بالسهولة والمرونة 
مما يسمح للمبرمج من ضبط الجدولة السليمة للأحداث وذلك ما يجعل تلك الأسلوب الاختيار المناسب 
I TT TS‏ 
الافتراضية الذي ذ تم تقديمها في الوحدة الأولى. ولكن في حالة لغات البرمجة الحقيقية والكبيرة ة الحجم 
مل لغة السي أو غيرها من اللغات المعروفة الأخرى فإ القيام بذلك بكون في عاية الصعوية ودائما ما 

يتم اللجوء إلى توليد محلل الصيغ النحوية أوتوماتيكيا. وهناك عدة أسباب لذلك. الأول: هو صعوبة 
کا القواعد النحوية من شكل باكوس نور إلى شكل باكوس نور الموسع. وسندرس في الجزء القادم 
بديلاً لاستخدام الشكل الموسع ولكنه مكافئ له والسبب الثاني: عند التعامل مع قاعدة نحوية تحتوي على 
بدائل مثل القاعدة التالية: 


.| A> | B> 
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قد تكون هناك صعوبة في تحديد أي البدائل یتم استخدامها ومتی یتم اختیاریں <۸> ومتی یتم 
اختيار 8 <4> إذا كانت كل من و 8 يبدآن برمز لا نهائي. ولاتخاذ القرار المناسب فإن الأمر يتطلب 
تحديد مجموعة المفردات التي يمكن أن تبدأ بها كل من و م وهي ما تسمى مجموعة البداية أو 
المجموعة الأولى (م؟ ءز۴ ) وهذه المجموعة سبق الإشارة إليها في الوحدة الثالثة وسنتعرض لها 
ببعض التفصيل أيضا في الجزء بعد القادم. أما السبب الثالث فهو عند كتابة معالجة قاعدة نحوية 
كالتالية: 


A> €> 


فإن الأمر يستلزم معرفة أي المفردات تأتي بعد الرمز اللانهائي <۸> حيث أن تلك المفردات تعنى أن 
هذا الرمز قد لا يظهر فعلياً عند ذلك الموضع في الإعراب ومجموعة المفردات هذه تسمى المجموعة 
المتتالية ( م5 سهااه۴ ) وسوف نتعرض لها بالتفصيل في الجزء بعد القادم أيضا. 


وهناك اهتمام وأهمية كبيرة لتجهيز كل من المجموعة الأولى والمجموعة المتتالية ليس فقط لمعالجة 
حالات القواعد النحوية التى أشرنا إليها هنا ولكن أيضا لأنها تساعد فى اكتشاف الأخطاء فى المدخلات 
مبكرا مع إمكانية الاستعفاء عنها وهو ما سنوضحه في الجزء الأخير من هذه الوحدة. ٤‏ 

. الإعراب ا(1) اا 


هذا الأسلوب يقوم بعملية الإعراب باستخدام المكدس ( )عءه†5) بشكل مباشر بدلا من الاستدعاء 
التكراري الذي يستخدم في الأسلوب السابق للإعراب وتمثيل هذا المكدس بالطريقة المعتادة يساعد على 
انجاز عملية الإعراب بسهولة وبسرعة عالية ولتوضيح ذلك الأسلوب نستخدم القاعدة النحوية البسيطة 
التالية التي تولد سلسلة من الأقواس المتوازنة: 


S> (<S>) <S> | C> 


وبفرض سلسلة المدخلات فإن الجدول التالي يوضح خطوات عملية الإعراب من أعلى إلى أسفل لتلك 
المدخلات ` 


حيث يتكون الجدول من تلاثة أعمدة بالإضافة إلى الأرقام التي على اليسار والتي توضح ترتيب 
الخطوات» بينما يبين العمود الأول من الجدول محتويات مكدس الإعراب وقاع المكدس يكون ناحية 
اليسار. أما قمته فناحية اليمين ونرمز لقاع المكدس بعلامة الدولار ($) وبالتالي فإن المكدس عندما 


يحتوي على الرمز اللانهائي 5 في قمته فإنه سيظهر كما بلي: 


S $ 
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على أن يتم إضافة العناصر التالية من ناحية اليمين. أما العمود الثاني من الجدول فيظهر حروف 
المدخلات الذي يتم سردها من اليسار إلى اليمين مع استخدام علامة الدولار (§) للإشارة إلى نهاية 
المدخلات في حين يعطى العمود الثالث والأخير من الجدول وصف مختصر للإجراء الذي يتم اتخاذه 
لتغيير محتويات المكدس والمدخلات والذي تظهر نتيجته في الصف التالي من الجدول. 


هذا وتبدأ عملية الإعراب من أعلى إلى أسفل بإضافة رمز البداية (امط"۷؟ خ۲ه†5) الخاص 
بالقواعد النحوية التي تستخدم في تحليل الصيغ النحوية إلى مكدس الإعراب ويتم قبول سلسلة المدخلات 
تد تيع الإجر ات لذ أف كل من المكدس و المفخات فر غين أي أن النظاء الام اة اللاجكة 
للإعراب من أعلى إلى أسفل يكون كالآتي: 


$ Start Symbol Input String $ 


قبول $ $ 


وفي حالة المثال السابق فإن رمز البداية هو 5 وسلسلة المدخلات هي ويتم الإعراب باستبدال الرمز 
اللانهائي الذي يظهر في قمة المكدس بأحد الاختيارات من القاعدة أو القواعد النحوية الخاصة بهذا 
الرمز والمكتوبة باستخدام شكل باكوس نور حيث يتم الاختيار الذي يجعل مفردة المدخلات الحالية 
تظهر في قمة مكدس الإعراب وبالتالي يحدث التطابق مع مفردة المدخلات وعند ذلك يتم حذف المفردة 
المتطابقة من كل من المكدس والمدخلات أي أن الإجراءين الأساسيين للإعراب من أعلى لأسفل هما: 


1- استبدل الرمز اللانهائي ۸ الذي يظهر على قمة المكدس بالسلسلة عن طريق استخدام اختيار القاعدة 
النحوية . 


2- مطابقة المفردة التي على قمة المكدس مع مفردة المدخلات . 


a O TT 


ا مى الل الان قن الکن و المدکلات کرنان کا لی ۰ 


$5 $ 
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والقاعدة النحوية التي تستخدم لاستبدال الرمز اللانهائي 5 الذي على قمة المكدس هي 


(ء) ء بحيث يتم إضافة السلسلة )5)5 إلى المكدس ليصبح المكدس والمدخلات كما يلي: 


$ 5) S( $ 


والآن يظهر القوس الأيسر على دة قمة المكدس الذي يتطابق مع مفردة المدخلات لكي نصل إلى الوضع 
التالي: 


$5)S J5 
التجميع اليساري وحذف التكرار اليساري‎ . 


يعاني التكرار والاختيار في طريقة الإعراب ا(11)1 من نفس المشاكل التي تحدث لهما في طرقة 
الإعراب التنازلي التكراري ولهذا السبب لم نستطع حتى الآن إعطاء جدول الإعراب للقواعد النحوية 
الخاصة بالتعبير الرياضي البسيط الذي سبق تقديمه في الجزء السابق وبينما كان الحل لتلك المشكلة في 
طريقة الإعراب التنازلي التكراري هو استخدام الشكل E8۴‏ لكننا لا نستطيع تطبيق نفس الفكرة في 
طريقة الإعراب 11)1(1 وبدلا من ذلك يجب أن نقوم بإعادة كتابة القواعد النحوية باستخدام الشكل 8١۴‏ 
المعتاد ولكن بصورة يمكن أن يقبلها الخوارزمية الخاصة بطريقة الإعراب 1)1(1] والأسلوبين 
المعتادين الذين يمكن أن نطبقها في هذه الحالة هما حذف التكرار الئيnسlري‏ ) Left Recursion‏ 
(Removal‏ والتجميع اليساري (ع”أاه†ءه۴ ۴٠1ا)‏ وهذين الأسلوبين سيتم شرحهما في هذا الجزء مع 
الأخذ في الاعتبار ان تطبيقهما ليس من الضروري أن يضمن أن تحويل القواعد النحوية إلى قواعد 
نحوية مقبولة بواسطة الإعراب 11)1(1 وذلك مثل ما كان بالنسبة للشكل 8۴ع الذي لا يضمن أيضاً 
حل جميع المشاكل عند أعداد الإعراب التنازلي التكراري ولكن مع ذلك فإن هذين الأسلوبين يكونان 
فعالان جدا في أغلب الحالات التطبيقية ولهما ميزة إمكانية تطبيقهما أوتوماتيكيا وبافتراض نجاح ذلك 
فإن الإعراب ]1)1(i‏ باستخدام تلكما الأسلوبين يمكن أن يتم توليده أوتوماتيكيا. 


خحذف التكرار اليساري 
إن التكرار اليساري (ع۷أواںءمR‏ ۴ع1) شائع الاستخدام لجعل اتحاد العمليات من ناحية اليسار كما في 
الفا عة النحوية التالنة الخاضة بالتعنير. الرياشن' الست 


exp exp addop term | term 


الى تكن الات التي ما و 6 وات :اتك من فاح الان وة الط من اران ارى 
تعد من أبسط الحالات وهي حالة وجود اختيار وحيد في القاعدة النحوية يحتوي على تكرار يساري 
ولكن الأمر يصبح أكثر تعقيدا في حالة وجود أكثر من اختيار في القاعدة النحوية يحتوي على مثل هذا 
التكرار اليساري وهو ما يحدث في حالة سرد عمليات م هلله كما في القاعدة النحوية التالية : 
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exp exp + term | exp E term | term 


وعموما فإن كلا الحالتين يتضمنان على تكرار يساري مباشر حيث أن التكرار اليساري يحدث فقط 
خلال نفس القاعدة النحوية الخاصة برمز لانهائي واحدة مثل م»ه في القاعدة النحوية السابقة والحالة 
الاكثر صعوبة هي حالة التكرار اليساري غير المباشر كما في القاعدتين النحويتين التاليتين: 


وهذه الحالة الأخيرة غالبا ما لا تحدث في القواعد النحوية الخاصة بلغات البرمجة الفعلية ولكننا سنقدم 
حل لتلك الحالة أيضا من أجل استكمال الحالات الثلاثة. 


الحالة الأولى : حالة التكرار اليساري المباشر البسيط 

في هذه الحالة يكون التكرار اليساري في القاعدة النحوية على الشكل: 

AAa| ® 

حيث كلا من ه و يمثلان سلسلة من الرموز النهائية واللانهائية ولا تبدأ بالرمز اللانهائي ۸ ولحذف 
التكرار اليساري فانه يعاد كتابة هذه القاعدة النحوية في قاعدتين الأولى تقوم بتوليد أولا والأخرى تولد 
التكرار الخاص ب » باستخدام التكرار من ناحية اليمين بدلا من التكرار اليساري كما يلي : 


'A3 BA 


A>aA' | € 


مثال 1 

بفرض أحد القواعد النحوية الخاصة بالتعبير الرياضي البسيط السابق الإشارة إليها : 

exp 2 exp addop term | term 

فهذه القاعدة على شكل الحالة الأولى حيث "۲ع = 8 , u = addopم te٣۳‏ , م×e‏ = ۸ وبالتالي سیعاد 
كتابتها لحذف التكرار اليساري لتصبح كما يلي : 

'Exp 2 term exp 


Exp' 2 addop term exp' | € 


الحالة الثانية : الحالة العامة للتكرار اليساري المباشر 
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في هذه الحالة تكون القاعدة النحوية على الشكل الآتي: 

حيث لا يبدأ أي من بالرمز اللانهائي ۸ ويكون الحل في تلك الحالة مشابه للحالة البسيطة السابقة مع 
زيادة عدد الاختيارات كما يلي : 

مثال 2 

بفرض القاعدة النحوية التالية : 

exp exp + term | exp B term | term 

فسنقوم بحذف التكرار اليساري كما يلي : 

'exp term exp 


exp' + term exp' | - term exp' | € 


الحالة الثالثة : حالة التكرار اليساري العامة 


هذه الحالة العامة تغطي جميع احتمالات التكرار اليساري سواء البسيط أو غير البسيط وأيضا المباشر 
أو الغير مباشر وعند ذلك نقوم باستخدام خوارزمية تضمن العمل بنجاح في حالة القواعد النحوية التي لا 


e 


إمكانية وجود اشتقاق من خطوة واحدة على الأقل يبدأ وينتهي بنفس الرمز اللانهائي أي كما يلي : 
A a *A‏ 


لأن وجود مثل هذه الدائرة في القواعد النحوية يجعل خوارزمية الإعراب تدخل في حالة تكرار غير 
منتهية ( م٠٥ه٠|‏ هاا م|) وبصفة عامة لا تتضمن القواعد النحوية الخاصة بأي لغة من لغات البرمجة 
على مثل هذه الدائرة كما أنها لا تحتوي على قواعد نحوية ذات سلسلة فارغة إلا في حدود ضيقة جداً 
وبشكل مقيد لذلك فإن الخوارزمية الذي نقدمه هنا سوف يعمل دائما لمثل هذه القواعد النحوية حيث تقوم 
هذه الخوارزمية بترتيب الرموز اللانهائية التي تشملها اللغة بأي ترتيب وليكن ۸2 ۸1 ل١۸‏ وبعد ذلك 
يتحاشى وجود أي قاعدة نحوية على الشکل : ۷ ز۸ ¡۸ 


عندما تكون ¡ _> ل وإذا تم ذلك لجميع قيم ال ¡ فإن هذا يعني عدم ترك أي تكرار لان الفهرس في هذه 
الحالة يكون تصاعديا ونفس الفهرس لا يمكن الوصول إليه مرة أخرى وفيما يلي خطوات تلك 
الخوارزمية : 

For i := 1 to mM do 


For j := 1to i-1 do 
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replace each grammar rule choice of 


the farm Ai Aj B by the same rule 


Ai a1B | a28 | ... | ak B where 

Aj a1 | a2 | ... | aK in the current rule 
For Aj 

مثال 3 


بفرض القواعد النحوية التالية : 

A Ba | Aa | C 

B Bb | Ab | d 

وبالطبع أن تلك القواعد افتراضية بالكامل لا يمكن حدوثها في أي لغة من لغات البرمجة المعتادة وفي 


هذا المثال نفترض أن الرمز اللانهائي 8 رقمه أعلى من الرقم الخاص بالرمز اللانهائي ۸ ( بمعنى أن 
۸14 و ۸2-8 ) حتى يمكن تنفيذ الخوارزمية السابقة وحيث أن 2م فإن أمر ۴٥۲‏ الخارجي في 


الخوارزمية يتم تنفيذه مرتان وعندما يكون 1=¡ فإن أمر ۴٥٣‏ الداخلي لن يتم تنفيذه وبالتالي فإن الإجراء 
الوحيد الذي سيتم هو حذف التكرار اليساري المباشر للرمز اللانهائي ۸ لتصبح القواعد النحوية السابقة 
كما يلي: 

'A BaA' | cA 

A' aA'| € 

B Bb | Ab | d 

أما عندما يكون 2=¡ فإن أمر ۴٠٣‏ الداخلية سيتم تنفيذه مرة واحدة ويكون فيه 1-=ز وفي هذه الحالة سيتم 
حذف القاعدة النحوية ا۸ 8B‏ عن طريق استبدال الرمز اللانهائي ۸ بكل اختياراته من القاعدة الأولى 
وعند ذلك تصبح القواعد النحوية كا لآتي : 

'A BaA' | cA 

A' aA' | € 


B Bb | Bb | Ba A'b | ca'b | d 
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وفي النهاية يتم حذف التكرار اليساري المباشر للرمز اللانهائي 8 ونصل إلى القواعد النحوية التالية 
التي لا تحتوي على أي تكرار يساري: 


'A BaA' | cA 
A' aA' | € 
'B cA'bB' | dB 


B' bB' | aA'bB' | € 


الآن وبعد الانتهاء من حل جميع حالات مشكلة التكرار اليساري يجب التأكيد على أن حذف التكرار 
اليساري من القواعد النحوية الخاصة بأي لغة من اللغات لا يؤثر على اللغة نفسها ولكنه يحدث بعض 
التغير في تلك القواعد النحوية وأيضا في شجرة الإعراب. وهذا التغير يؤدي إلى تعقيد عملية الإعراب 
وتصميم وحدة الإعراب الخاصة بهذه اللغة ولتوضيح إلى القواعد النحوية الخاصة بالتعبير 


الرياضي البسيط التي يتم استخدامها كمثال والتي تتضمن غذة تر ارات سار ية رذلك: لتر :ع 
الاتحاد اليساري للعمليات فإذا تم حذف هذه التكرارات ا المباشرة من تلك القواغة النخوية 


'exp term exp 

exp' addop term exp' | € 

- | + addop 

'term factor term 

term' mulop factor term' | € 
* mulop 

factor (exp) | number 

وبفرض التعبير الرياضي 3-4-5 فإن شجرة الإعراب التي تمتل ذلك التعبير ستكون كالآتي : 

حيث يلاحظ أن تلك الشجرة لا توضح الاتحاد اليساري لعملية الطرح بل على العكس تظهر أن الاتحاد 
الخاص بهذه العملية من ناحية اليمين وذلك كنتيجة لحذف التكرار اليسار واستبداله بتكرار يميني كما هو 


واضح في القواعد النحوية من خلال الإعراب لابد أن ينشأً شجرة النحو 


السليمة التي تعكس الاتحاد اليساري لعملية الطرح والتي تكون كما يلي : 
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وهذه المهمة ليست بالبسيطة عند استخدام القواعد النحوية الأخيرة ولكن دعنا نوضح كيفية القيام 
بذلك في حالة شجرة الإعراب السابقة ولكي يتم هذا فإن القيمة 3 يجب تمريرها من جذر الشجرة م×ع 
إلى ابنهما الأيمن التي تمتله العقدة م×ه' حيث يتم طرح القيمة 4 على أن يمرر الناتج 1- إلى ابنها الذي 
على أقصى اليمين العقدة م×ه' الثانية التي تقوم بدورها بطرح 5 لتصل إلى الناتج 6- الذي يتم تمريره 
إلى العقدة م×ه' الأخيرة التي لا يوجد لها إلا ابن واحداً هو السلسلة الفارغة € لذلك فهي تقوم بإرجاع 
التابع الأخير إلى أعلى شجرة الإعراب ليصل في النهاية إلى جذر الشجرة الممثل بالعقدة م×٠‏ ويكون 
ذلك هو القيمة النهائية للتعبير الرياضي 3-4-5 التعبير الرياضي عن تطبيق الاتحاد اليساري لعملية 
الطرح. ونوضح الآن كيفية القيام بذلك العمل في أسلوب الإعراب التنازلي التكراري السابق عرضه في 
الجزء السابق وبالنسبة للقواعد النحوية الأخيرة الخاصة بالتعبير الرياضي البسيط بعد حذف التكرار 
اليساري منها سيكون كل من الإجراءين م×ه و م×ع' كما يلي: 


procedure exp 
begin 

, term 

; exp 

; end exp 

' procedure exp 
begin 

case lookahead of 
; (+') match ; '+' 
, term 

; exp 

; (-") match : '-' 


;, term 
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; 'exp 
; end case 


; 'end exp 


ولجعل الإجراءين السابقين يقومان بحساب قيمة التعبير الرياضي بشكل فعلي نحتاج إلى إعادة كتابتهما 
ليصبحا كما يلي: 


function exp ; integer 

; var temp ; integer 

begin 

, temp : = term 

; (return exp' (temp 

; end exp 

function exp' (valuesofor: integer): integer 
begin 

if lookahead = '+' or lookahead = 'Athen 
case lookahead of 

; (*') match : '+' 

; valuesofor : = valuesofor + term 

; (-") match : '-' 

; valuesofor : = valuesofor E term 

; end case 


; (return exp' ( valuesofor 
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; else return valuesofor 
; 'end exp 


ويلاحظ أن الإجراء م×ه' احتاج في وضعه الأخير أن تمرر له معاملات من الإجراء م×ع وهو موقف 
مشابه لما يحدث من تلك الإجراءات عند إرجاع شجرة النحو التي تعكس الاتحاد اليساري للعمليات. 


وفي النهاية يجب ملاحظة أن القواعد النحوية في وضعها الأخير بعد حذف التكرار اليساري هي قواعد 
نحوية في صالحة لتطبيق طريقة الإعراب ]1)1(i‏ عليها وذلك باستخدام جدول الإعراب التالي الذي 
سنشر ح كيفية إعداده في الجزء القادم: 


التجميع اليساري 


يكون التجميع اليساري مطلوب عند وجود أكثر من اختيار في القاعدة النحوية يشتركان في جزء من 
أقصى يسار الاختيار كما في القاعدة التالية 


AaB | aY 
٠ ¡f وكمثال آخر من لغات البرمجة القاعدة النحوية التالية الخاصة بأمر‎ 
If El stmt if (exp) statement 


if (exp) statement else statement |‏ 
وتكمن المشكلة بالنسبة لطريقة الإعراب 11)1(1 في عدم القدرة على التمييز بين الاختيارات في هذه 
الحالة ويكون الحل في تجميع الجزء المشترك بين الاختيارات مع اعادة كتابة القاعدة النحوية والقاعدة 
الأولى من هذا الجزء تصبح كما يلي بعد التجميع وإعادة كتابتها : 
'AaA‏ 
A' B| Y‏ 
أو أن تكتب كالآتي مع استخدام الأقواس: 
(Aa(B| Y‏ 
وهو الشكل الذي يشبه كثيرا عملية التجميع في التعبيرات الرياضية وعملية التجميع من ناحية اليسار 
يمكن أن تتم في حالة وجود أكثر من اختيارين في القاعدة النحوية والخوارزمية التالية تقدم الحالة العامة 


لاجراء التجميع اليساري: 


While these are changes to the grammar do 
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for each nonterminal A do 

let be a prefix of maximal length that is shared by two or more - 
production choices for A 

if a = € then 

let A a1 | a2 | e | an be all the Production choices for - 


: A and sppose that a1 ,..., ak share a so that 


and the share no common prefix 
an do not share a, ,and the ak+1 


:replace the rule A a1 | a2 | E: | an By the rules - 


مثال 4 


بفرض القاعدة النحوية التالية الخاصة بتتابع الأوامر في لغات البرمجة والتي تحتوي على تكرار من 
ناحية اليمين : 


stmt Bl sequence stmt; stmt El sequence | stmt 

حيث يلاحظ وجود جزء مشترك بين الاختيارين من ناحية اليسار وبالتالي يمكن إجراء التجميع مع 
إعادة كتابة القاعدة النحوية لتصبح كما يلي : 

'stmt EH sequence stmt stmt El seq 

stmt E seq' ; stmt E sequence | € 

مثال 5 

بفرض القاعدة النحوية التالية الخاصة بأمر ۴¡ : 

If BH stmt if (exp) statement 
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if (exp) statement else statement | 
: فإن التجميع اليساري لهذه القاعدة النحوية سيجعلها تصبح كالآتي‎ 
If BH stmt if (exp) statement else El post 
Else - post else statement | € 
6 مثال‎ 


بفرض كتابة القاعدة النحوية الخاصة بالتعبير الرياضي ولكن لاحد العمليات ذات الاتحاد من ناحية 
اليمين وليكن الاس فانها ستكون كما يلي : 


exp term * * exp | term 
: فإن هذه القاعدة النحوية تحتاج إلى تجميع يساري لتصبح كما يلي‎ 
'exp term exp 


exp' * * exp | € 


وفي النهاية يجب ملاحظة أن جميع القواعد النحوية التي في الامثلة السابقة وبعد تطبيق التجميع 
اليساري عليهم أصبحت صالحة لاستخدام أسلوب الاعراب ا(1)1] معها وسوف نقوم بإعداد الاعراب 
الخاص ببعضهم في الجزء القادم ٍ 


3.4 بناءِ شجرة النحو في الاعراب LL(1)i‏ 


E E ET 
تطبيق هذا الاسلوب من الاعراب وقد سبق وشاهدنا تطبيق أسلوب الإعراب التنازلي التكراري إن‎ 
استخدام شجرة النحو سهل نسبيا ولكن تعديل اسلوب الإعراب ا(11)1 لكي يقوم باستخدام شجرة النحو‎ 
ا ف اك رن هك كج لخر فن وة ل ته ل لسار ا ع ور‎ 
الاي رفا هة ا ن كن ار رات ل فا ا كت ا ر اا افا ر ا کے‎ 
pêg E Ng ESIR GG ES 
ی غ ن غر ا‎ E E 

E 


0 
2 


5. المجموعات الأولى والمجموعات المتتالية 


لتطبيق الخوارزمية الخاصة بأسلوب الإعراب 11)1(1 فإن الأمر يستلزم تطوير خوارزمية لبناء 
جدول الإعراب المستخدم مع ذلك الأسلوب وهذا يتطلب كما أشرنا لذلك من قبل حساب كل من 


105 


جامعة النيلين - كلية العلوم/ مدرسة العلوم الرياضية- إعداد / عمر إبراهيم عبدالله Compiler for msc of cs‏ 


المجموعات الأولى (ءام؟ tء٣أ۴)‏ والمجموعات المتتالية (ئخم؟ سهااه۴) وسوف نقوم في هذا الجزء 
بتعريف وتجهيز هذه المجموعات وبعد ذلك نقوم بتقديم وصف دقيق لكيفية انشاء الإعراب )1(i‏ 11 . 


5 المجموعات الأولى 


إذا كانت × هي أحد رموز القواعد النحوية سواء كانت نهائية أو لا نهائية أو حتى السلسلة الفارغة € 
فإن ا(۸) ء٣۴‏ تتكون من رموز نهائية و في بعض الحالات وفقا للقواعد الآتية : 


1- إذا كانت »× هي رمز نهائي أو € فإن إ») = ا(»)اءا؟ . 


2- إذا كانت »× هي رمز نهائي فلكل اختيار في القواعد النحوية على الشكل ×1×28× < × فإن 
ا(1)۸٣|۴‏ تحتوي على إ ) - ا(1»)ء|۴ وإذا كانت أيضا كل المجموعات 1»)غfirst(xn)i,,(firs‏ 
تحتوي على حيث ۸>¡ فإن وفي حالة ماإذا كانت جميع المجموعاٽت first(xn)i,,(first(%1‏ 
تحتوي على فإن(×ه) 5٣ا‏ تحتوي أيضاعلى . 


والآن وبعد الانتهاء من تعريف ا(»)اء٣‏ |۴ نقوم بتعريف ( ا)اء٣ا۴‏ لأي سلسلة من الرموز النهائية 
واللانهائية عندما تكون = "×1×28× فان () ءا تحتوي على ال٥‏ {-(1»)ءا۴ وأيضا إذا كانت كل 
المجموعات 1)»1ءf),,ا(أ»)tء٣؟‏ تحتوي على عندما تكون ۸>¡ فإن() ء٣۴‏ تحتوي على [ 
¡ { 8 (1+t)×iءfir‏ وأهيرا إذا كانت ا(أ»)اءءا؟ تحتوي على لكل 1,2,3-=أ,," فإن() ء٣۴‏ تحتوي أيضا 
على . 


والتعريفات السابقة یمکن بسهولة تحويلها إلى ا لحساب المجموعات الأولى ولان إيجاد 
اللانهائية لذلك فإن الخوارزمية التالية E‏ المجمو عات الأولى ا اللانهائية فا 

ون اکان رف مر ها كرون فة الراررة الما ی جد وود آي عار ا ا 
النحوية يحتوي على ستصبح الخوارزمية أبسط كثيراً لأن (۲)۸ء٣٠۴‏ في هذه الحاله ستحتوي فقط على 
ا(۴51)×1ذ۴ وبالتالي فإن الخوارزمية المبسطة ستصبح كما يلي: 


; {}= (For all nonterminal A do First (A 

While there are change to any first (A) do 

For each production choice A X1, x2, x3... xn do 

;(Add First(x1) to First (A 

وعموما فإنه عند حساب المجموعة الأولى لأي رمز لا نهائي لا يتم فقط تحديد الرموز النهائية التي 
يمكن أن تظهر كرمز أول في سلاسل الحروف المشتقة من ذلك الرمز اللانهائي ولكن يتم أيضا تحديد 
ما إذا كانت السلسلة الفارغة ع يمكن أن تشتق من هذا الرمز اللانهائي و الذي يطلق عليه في هذه الحالة 


رمز قابل للفراغ ( عاط ھااں١)‏ فأي رمز لا نهائي ۸ يكون قابل للفراغ عند وجود اشتقاق على الشكل 
أي عندما يكون ۸(i)ء٣أ۴‏ تحتوي على . 
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و الآن نقدم مجموعة من الأمثلة لحساب المجموعات الأولى للرموز اللانهائية: 

مثال 7 

بفرض القواعد النحوية التالية الخاصة بالتعبير الرياضي البسيط والذي سبق أن عرضناه من قبل: 
exp exp addop term | term‏ 

- | + Addop 

term term mulop factor | factor 

* Mulop 

Factor (exp) | number 


من الأسهل أن نعيد كتابة القواعد النحوية السابقة بحيث يكون كل اختيار في سطر منفصل مع ترقيم كل 
اختيار من تلك الإختيارات كما يلي: 


exp exp addop term (1) 
exp term (2) 

+ addop (3) 

- addop (4) 

term term mulop factor (5) 
term factor (6) 

* mulop (7) 


(factor (exp (8) 


factor number (9) 
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وتلك القواعد النحوية لا تحتوي على أي اختيار يتضمن وبالتالي سنستخدم الخوارزمية المبسطة 
لحساب المجموعات الأولى ولكن قبل ذلك يجب ملاحظة أن كل من الاختيار رقم (1) والاختيار رقم 
(5) يحتويان على تكرار يساري وبالتالي فإن تلك القواعد النحوية لا تصلح للاستخدام في وضعها 
الحالي مع أسلوب الإعراب ا(11)1 ولا يمكن أن نبني لها جدول الإعراب المستخدم في هذا الأسلوب 
ولكن هذا لا يمنع إمكانية حساب المجموعة الأولى للرموز اللانهائية التي تتضمنها تلك القواعد النحوية 
مع عدم الاستفادة من هذه الاختيارات التي تحتوي على تكرار يساري في هذه المهمة وذلك ما سيتضح 
عند حساب المجموعات الأولى والجدول التالي يوضح خطوات ذلك حيت يسجل الجدول فقط التغيرات 
التي تحدث في الخانة المقابلة للاختيار الذي أحدث ذلك التغير والخانات الفارغة تعني عدم حدوث تغير 
في هذه الخطوة. 

ولا بد من إتمام دورة رابعة وأخيرة والتي لا تظهر في الجدول السابق لأنه لن يحدث بها أي تغير 
وبالتالي فإنه بعد أربع دورات ننتهي من حساب المجموعات الأولى التالية: 

{ First (exp) = { ( ,number 

{ First (term) = { (,number 

{ First (factor) = { ( ,number 


{ -, +} = (First (addop 


{ * † = (First (mulop 


مثال 8 

بفرض القواعد النحوية التالية والخاصة بأمر ۴¡ ولكن بعد إجراء التجميع اليساري عليها: 
statement if - stmt | other‏ 

if - stmt if (exp) statement else - part 

| else - part else statement 

exp 0| 1 


وهذه القواعد تتضمن أعلى اختيارات بها وذلك مع الرمز اللانهائي اهم - عءام فقط أي انه الرمز 
الوحيد المقابل للفراغ وبالتالي سيكون التعقيد فقط مع هذا الرمز وباقي الرموز اللانهائية لن تكون كذلك 


f 


ولن تتأثر وهذا ما يحدث عادة في أغلب القواعد النحوية الخاصة بلغات البرمجة الفعلية حيث تكون 
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الاختيارات التي تتضمن محدودة للغاية وكالمثال السابق نبدأً بكتابة الاختيارات التي تحتوي عليها 
القواعد النحوية بشكل منفصل كالاآتي: 


statement if - stmt 

Statement other 

If - stmt if (exp) statement else - part 
else - part else statement else -part 
else - part e 

exp 0 


exp 1 


والجدول التالي يوضح خطوات ودورات حساب المجموعة الأولى كما في المثال السابق: 
وبعد إتمام الدورة الثالثة التي لا يحدث بها أي تغير نصل إلى المجموعات الأولى لتالية: 
{First (statement)={ if, other‏ 

{ First (if-stmt)={ if 

{First (else-port)={ else 

{First (exp) = {0, 1 

مثال 9 

بفرض القواعد النحوية التالية الخاصة بمتابعة الأوامر: 

'stmt-sequence stmt stmt-seq 

stmt-seq' ; stmt-seq 


stmt S 


ومرة أخرى نقوم بإعادة كتابتها ليكون كل اختيار في سطر منفصل كالأتي: 
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'stmt-sequence stmt stmt-seq 

stmt-seq' ; stmt-seq 

'Stmt-seq 

Stmt S 

وبعد ثلاثة دورات نحصل على المجمو عات الأولى التالية: 
{First (stmt-sequence) ={s‏ 

{ ,;} = (First (stmt-seq 


{First (statement) = {S 
التكمو غات اة‎ 


إذا كان ۸ هو أحد الرموز اللانهائية فإن المجموعة (۸)س٠|ااه۴‏ تتكون من رموز نهائية وأيضا الرمز 
$ في بعض الحالات وفقةا للقواعد التالية: 

1 إذا کان ۸ هو رمز البداية فإن $ تكون في ¡(w)۸‌ه‌ااه۴‏ . 

2) إذا كان هناك قاعدة نحوية مثل تكون في ¡(w)۸٥ااه۴‏ 

3 إذا كان هناك قاعدة نحوية مثل تحتوي على فإن ¡(W)۸سه|ااه۴‏ تحتوي على ¡(ow)8‌|ااه۴‏ . 
E E Ea E aE‏ 

* الأولى أن الرمز $ الذي يستخدم للإشارة إلى نهاية المدخلات يظهر في المجموعة التالية لرمز البداية 
وهذا أمر طبيعي لكون رمز البداية هو الذي يشتق منه جملة المدخلات وبالتالي فإن ما يتبع جملة 
المدخلات هو مؤشر نهاية المدخلات. 


* النقطة الثانية أن السلسلة الفارغة لايمكن أن تظهر فى المجموعة التالية وذلك لكونها تظهر فى 
الخو عة ا لرل فقط و ل يكن فهو ر ها خن فرذت جا اماف ٤‏ 
* النقطة الثالثة فهي أن المجموعة التالية يتم حسابها فقط للرموز اللانهائية وذلك بخلاف المجموعة 
الأول التي كان يتم حسابها للرموز النهائية وسلسلة الرموز النهائية واللانهائية أيضا وكان من الممكن 
ان يتم ذلك أيضا بالنسبة للمجموعى التالية ولكن ذلك غير ضروري وذلك لن إنشاء جدول الإعراب 
ا(1)1] يحتاج المجموعات التالية الخاصة بالرموز اللانهائية فقط. 
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* النقطة الأخيرة ان تعريف المجموعة التالية يعتمد على الجانب الأيمن من القاعدة النحوية بعكس 
تعريف المجموعة الأولى الذي كان يعتمد على الجانب الأيسر من القاعدة النحوية وكقاعدة عامة فغن 
كل اختيار في قاعدة نحوية سيساهم في المجموعات التالية لكل رمز لأنها في الجانب الأيمن من القاعدة 
النحوية وهذا لا يحدث في حالة المجموعات الأولى لن كل اختيار في قاعدة نحوية سيضيف للمجموعة 
الأولى رمزاً ل نهائیاً وحيداً فقط وهو الرمز اللاآنهائي الذي يظهر في الجانب الأيسر من القاعدة 
النحوية. 

والآن نقدم الخوارزمية الخاصة بالمجموعات التالية تلك الخوارزمية التي تقوم بحساب المجموعات 
(Follow (start-symbol‏ :=}${; 

;{ } = (For all nonterminal A start symbol do Follow (A 

While there are changes to any follow sets do 

For each production A X1 X2 Xn do 

For each Xi that is a nonterminal do 

;(Add First (Xi+1 Xi+2 Xn) - { } to Follow (Xi 

If is in First ( Xi+1 Xi+2 Xn ) then 

;(Add Follow (A) to Follow (Xi 

a‏ قواعد ا تحتوي e‏ السلسلة اا ونقدم الآن تلاثة أمثلة لات اضر عاك التالية 
وهي نفس الأمثلة التي سبق أن تم حساب المجموعة الأولى لها. 

مثال 10 


مرة آخرى بفرض القواعد النحوية الخاصة بالتعبير الرياضي البسيط والتي تم حساب المجموعات 
الأولى لها في مثال رقم 7 والتي كانت كما يلي: 


{first(exp) = {(, number 
{first(term) = {( , number 
{first(factor) = {(, number 
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{-,+}=(first(addop 


{*=(first(mulop 


ونعيد الآن كتابة اختبارات تلك القواعد النحوية بشكل منفصل كالأتي: 


exp exp addop term (1) 
exp term (2) 

+ addop (3) 

- addop (4) 

term term mulop factor (5) 
term factor (6) 

* mulop (7) 


(factor (exp (8) 


Factor number (9) 


Compiler for msc of cs 


حيث نلاحظ أن الاختبارات النحوية رقم ( 3)ء( 4 ( ٠‏ (7)ء (9) لا تحتوي على رموز لانهائية في 
الجانب الأيمن للقاعدة النحوية وبالتالي فإنها لن تضيف شيئا عند حساب المجموعات المتتالية وسنستخدم 
فقط باقي الإختيارات بالترتيب على أن نبدأ بإضافة الرمز $ للمجموعة المتتالية الخاصة بالرموز 
اللانهائية الأخرى فإنها ستبدأ فارغة وبعد ذلك عند استخدام الاختيار رقم 1 فإنه سيؤثر على 
المجموعات المتتالية الخاصة بتثلاثة رموز لا نهائية هي م×هء مهللهء 6۲۳ حيث سيتم إضافة 


(مەلهه)ءاtء۴ir‏ إلى المجموعة المتتالية ل م×م وبالتالي ستصبح كما يلي: 


{- ,+ ,$} = (Follow (exp 


وكذلك سيتم إضافة ٠"(i‏ )۲ء٣۴‏ إلى المجمو عة المتتالية ل مم للج مما يجعلها تصبح كالاآتي: 


{Follow (addop) = {(, number 
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وا ا ال ع اا ووو إل الك عة اة ل وو كن ال عة اكا د 
tm‏ لتصبح كما بلي: 


{-,+ ,$} = (Follow (term 


وعند استخدام الخيار رقم 2 سيتم إضافة المجموعة المتتالية ل م×م إلى المجموعة المتتالية ]6٣۳‏ وهو 
رک ی وا ی ن ا ق اا ر 
اللانهائي ص٣ع]‏ . 


بينما عند استخدام الاختيار رقم 5 سیتم إضافة First(mulop)i‏ إلى المجموعة المتتالية ل صع† 


{*,- ,+ ,$} = (Follow (term 


ثم سيتم إضافة ا(۲هاعهf)اءا۴‏ إلى المجموعة المتتالية ل مماام لتصبح كالأتي: 
Follow(mulop)={(, number} i‏ 

وأخيرا سيتم إضافة المجموعة المتتالية ل ص٣٠‏ إلى المجموعة المتتالية ل مه۴ لتصبح كالأتي: 
(Follow (factor‏ = }$, +,-,*{ 

ولن يؤثر استخدام الاختيار رقم 6 على حالة المجموعة المتتالية الخاصة بالرمز اللاآنهائي fact‏ بینما 


سيؤدي استخدام الاختيار رقم (8 ) إلى إضافة ا('(')۲ء٣ا۴‏ على المجموعة المتتالية ل م×ء لتصبح 
كالتالي 


{(, -,* , $ } = (Follow (exp 


وعند ذلك تنتهى الدورة الأولى لحساب المجموعات المتتالية للرموز اللانهائية وبعدها تبداً الدورات التى 
ا ةا حت ركن الجدزل الات ملخفا اذررات: كماد ك التخر غات المالة فرشتا 
التغييرات التي ستحدث عند استخدام كل اختيار من اختيارات القواعد النحوية بعد استبعاد الاختبارات 
رقم 3 , 4, 7 , 9 التي لن تؤثر على حساب المجموعات المتتالية: 
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ولن يحدث أي تغيير في الدورة الثالثة التي لم تظهر في الجدول السابق وبالتالي سينتهي حساب 
المجموعات التالية للرموز اللانهائية وستكون كما يلي في وضعها الأخير: 

{(,_,*, $ } = (Follow (exp 

{Follow(addop)={ (, number 

{(.*,-,+,$} =(Follow(term 

{Follow(mulop)={(,number 


{(,*,-,+,$ }=(Follow(factor 


متال 11 

او ع ك ا 
الأولى بها في المثال رقم 8 وكانت كما يلي: 

{First(statement)={if, other 

{First(if A stmt)={if 

{, First(else-part)={else 

{First(exp)={0,1 

وبإعادة كتابة اختيارات القواعد النحوية بشكل منفصل كالآتي: 
statement Zif H stmt (1)‏ 

statement Z2other (2) 

if MH stmtZif (exp) statement else H part (3) 


else Epart >else statement (4) 
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else BH part (5)‏ ج 

exp > 0 (6) 

exp321 (7) 

ونلاحظ أن الاختيارات رقم (2) , (5) ,(6) ,(7) لا تحتوي في الجانب الأيمن على أي رموز لا نهائية 
لذلك فإنها لن تضيف شيء عند حساب المجموعات المتتالية وسنستخدم فقط باقي الاختيارات بالترتيب 
على أن نبدأً بإضافة الرمز $ إلى المجموعة المتتالية الخاصة برمز البداية اللانهائي ٤٣ع"‏ عهاء بينما 
باقي المجموعات المتتالية الخاصة بالرموز اللانهائية الأخرى فإنها ستبدأً فارغة وبعد ذلك عند استخدام 


الاختيار رقم (1) سيتم إضافة المجموعات المتتالية ل ٤٣٠ص‏ ههء إلى المجموعات المتتالية للرمز 
اللانهائي ا" اء 8 ۴¡ لتصبح كما يلي: 


{$}= (Follow(if H stmt 


ع اكا ا ار ق مف و 5 ع ا غ ا ا ارو 5 
statement, exp‏ ,artم-seاe‏ حيث يتم إضافة ا('(')1ء٠٠۴‏ إلى المجموعة المتتالية ل م×ع لتصبح 
ا ()=(مow)exااfo‏ ثم يضاف اإ8-(٤إaم-عءاع)اءrا۴‏ إلى المجموعة المتتالية ل "عص ع]هاء لتصبح 
كالآتي: 


{Follow(statement) ={$,else 


وأخيرا يتم إضافة المجمو عة المتتالية ل اء -۴| إلى المجموعة المتتالية ل 
else Blpart‏ 


وأيضا إلى المجموعة المتتالية ل "ع" هاء ليصبحا كما يلي: 


{$}=(Follow (else- part 
{Follow(statement)={$,else 


ويلاحظ عدم حدوث تغيير على المجموعة المتتالية ل ٣۲‏ هم" ٠هء‏ وعند استخدام الاختيار رقم (4) فإن 
المجمو عة المتتالية ل اهم 8 عءام يتم أضافتها إلى المجموعة المتتالية "١‏ م" عه]ء والذي لن يحدث 
أي تغيير عليها وبذلك تنتهي الدورة الأولى لحساب المجموعات المتتالية للرموز اللانهائية لتبدأ الدورة 
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الثانية باستخدام الإختياررقم (1) حيث تتم إضافة المجموعة المتتالية ل ٤٣ع"‏ هه]ء إلى المجموعة 
المتتالية ل ( خ"اء-۴) لتصبح كما يلي: 


{Follow(if-stmt)={$ ,else 


أما استخدام الاختيار رقم (3) فإنه سيؤدي إلى إضافة المجموعة المتتالية 

ل ¡f stmt‏ لتصبح كالاآتي: 

{Follow(else- part)= {$,else 

وأخيرا لن يغير استخدام الاختيار رقم (4) أي شيء بالنسبة للمجمو عة المتتالية ل "عم" عهء وبذلك 
تنتهي الدورة الثانية لتبدا الدورة الثالثة التي لن تحدث آي تغير على المجموعات المتتالية للرموز 
اللانهائية حيث تكون تلك المجموعات المتتالية كما في وضعها الأخير : 
{Follow(statement)={$,else‏ 

{Follow(if-stmt)={$ ,else 

{Follow(else - part)={$,else 

{¢=(Follow(exp 

مثال12: 


في هذا المثال نقوم بحساب المجموعات المتتالية للقواعد النحوية الآتية الخاصة بتتابع الأوامر والتي 
سبق تقديمها في المثال رقم (9) : 


'stmt - sequence 2 stmt stmt - seq (1) 

stmt - seq' 2 ; stmt - sequence (2) 

4 "stmt - seq (3) 

Stmt > S (4) 

وفي المتال رقم (9) تم حساب المجموعات الأولى و كانت كما يلي: 


{ First ( stmt - sequence ) ={s 
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{Frits (stmt) = {S 

{First (stmt - seq!" ) ={; , E 

والإختيارات رقم (3) و (4) لن تؤّثر على حساب المجموعات المتتالية حيث تستخدم باقي الإختيارات 
ونبدأً بإضافة الرمز $ الى المجموعة المتتالية ل مء" عںوءء - ٤ء‏ وباقي المجموعات المتتالية ستبداً 
فارغة وبعد انتهاء الدورة الأولى ستكون المجموعات المتتالية كما يلي: 

{$} = (Follow (stmt _ sequence 

{;} = (Follow (stmt 


{$}=( "Follow { stmt _ seq 


ولن يحدث أي تغير في الدورة الثانية وبالتالي ستبقى المجموعات المتتالية كما هي. 
بناء جدول الإعراب 11)1(i‏ 


نشرح الاآن كيفية بناء جدول الإعراب المستخدم في طريقة الإعراب ا(1)1] والسابق الإشارة اليه في 
الأجزاء السابقة من هذه الوحدة حيث يتم البناء وفقا للقاعدتين الأتيتين: 


1. إذا كان هو إحدى إختيارات القواعد النحوية وهناك الإشتقاق حيث ج هي أحد المفردات ففي هذه 
الحاله تتم اضافة إلى خانة جدول الإعراب i[ج‏ , ۸] 


2. إذا كان هو إحدى إختيارات القواعد النحوية وهناك الإشتقاق 
وكذلك الإشتقاق حيث ك5 هو رمز البداية و ۾ هي احدى المفردات ففي هذه الحاله تتم إضافة إلى خانة 


۸M]۸ , [i جدول الإعراب‎ 


وواضح أن المفردة ۾ تكون في القاعدة الأولى في ال () اء٣أ۴‏ بينما في القاعدة الثانية تكون في ال 
ا(4) ۴٥١٠١۳‏ وبذلك نصل إلى الخوارزم الأتي الخاص ببناء جدول الإعراب 11)1(i:‏ 


و الآن بعض الأمثلة الخاصة ببناء جدول الإعراب للقواعد النحوية السابق التعرض لها في الأمثلة 
السابقة من هذه الوحدة. 
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مثال 13: 

بفرض القواعد النحوية الخاصة بالتعبير الرياضي البسيط الذي تم استخدامه أكثرمن مرة خلال هذه 
الوحدة وحيث أن هذه القواعد في شكلها الأصلي تتضمن على تكرار يساري فقد تم حذف التكرار 
اليساري وأصبحت كما يلي : 

'exp term exp 

exp' addop term exp' | € 

- | + addop 

'term factor term 

term' mulop factor term' | € 

* mulop 

factor ( exp ) | number 

ولا بد أن نقوم بحساب المجموعات الأولى والتالية للرموز اللانهائية التي تحتوي عليها تلك القواعد 
النحوية وسوف نترك القيام بهذه الحسابات كتمرين للقارئ على أن نقدم النتيجة النهائية فقط لهذه 
المجموعة والتي ستكون كما يلي: 

{ First (exp) = { ( ,number 

{ First (exp') ={+,-,€ 

{- , + } = (First ( addop 

{ First (term) = { (,number 

{ First (term')={*,€ 

{ * † = (First (mulop 

{ First (factor) = { ( ,number 


{ (, $} = (Follow (exp 


{ (, $} = (Follow (exp 
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Follow (addop) = { (, number‏ { 

{-, +, (, $ } = (Follow ( term 

{-, +, (, $ } = (Follow ( term 

{ Follow (mulop) = { (, number 

{-, +, (, $ } = (Follow (factor 


والآن نستطيع بناء جدول الإعراب ]1)1(i‏ لتلك القواعد النحوية والذي سيكون كما يلي: 


حيث يلاحظ أن هذا الجدول هو نفس الجدول الذي تم عرضه من قبل عند شرح طريقة الإعراب 11)1(i‏ 


مثال 14: 

بفرض القواعد النحوية المبسطة لأمر f‏ الآتية: 
statement if - stmt | other‏ 

if - stmt if ( exp) statement else - part 
else - part else statement | € 

exp 0 | 1 

والتي كانت المجموعات الأولى والتالية الخاصة بها كما يلي : 
First ( statement ) = { if , other‏ { 

{ First ( if - stmt ) = { if 

{ First ( else - part) = {else , € 

{ First (exp) = {0,1 


{ Follow(statement )= { $ , else 
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{ Follow(if _ stmt )= { $ , else 
{ Follow(else - part )= { $ , else 
{ (} =(Follow(exp 


و بالتالي يمكتنا بناء جدول الإعراب 11)1(i‏ لتلك القواعد النحوية والذي سيكون كما يلي: 


وهذا الجدول أيضا هو نفس الجدول السابق عرضه من قبل شرح طريقة الإعراب 11)1(i‏ . 


مثال 15 : 

بفرض القواعد النحوية الأتية الخاصة بتتابع الأوامر والتي سبق تقديمها من قبل: 
'stmt - sequence stmt stmt - seq‏ 

stmt - seq' stmt - sequence j € 

stmt s 

والتي كانت المجموعات الأولى والتالية الخاصة بها كالآتي : 
{First( stmt - sequence )= {s‏ 

{ First( stmt - seq' )= {; € 

{First( stmt)= {s 

{$} =( Follow( stmt - sequence 

{$} = (Follow(stmt - seq 


{$ , ; } =(Follow( stmt 


وجدول الإعراب ا(1)1] الخاص بتلك القواعد النحوية سيكون كما يلي : 


. الإعراب التنازلي التكراري للغة الافتراضية 
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نناقش في هذا الجزء الإعراب التنازلي التكراري للغة الإفتراضية التي سبق تقدیمها في الوحدة 
الأولى كما تم في الوحدة السابقة عرض للقواعد النحوية الخاصة بها ووحدة الاعراب التي نقدمها تقوم 
بإنشاء شجرة النحو بالإضافة إلى طباعة هيكل هذه الشجرة في ملف يمكن استعراضه بعد ذلك. 


والإعراب التنازلي التكراري يستخدم الشكل 8۴ الآتي وهو المقابل للقواعد النحوية الخاصة بتلك 
اللغة الإفتراضية التي سبق عرضها باستخدام الشكل 8۸۴ في الوحدة السابقة: 


program stmt - sequence 
{stmt - sequence statement {; statement 
{statement if - stmt | repeat - statement 
assign - stmt | read - stmt | write - stmt | 

If - stmt if exp then stmt - sequence 

else stmt - sequence ] end ] 
repeat - stmt repeat stmt - sequence until exp 
assign -stmt read identifier 
write - stmt write exp 
[ exp simple - exp[comparison - op simple - exp 
= | > comparison - Op 
{simple - exp term {addop term 
- | + addop 
{term factor {mulop factor 
/ | * mulop 


factor ( exp ) | number | identifier 
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ووحدة إعراب اللغة الافتراضية تتبع الإطار العام للإعراب التنازلي التكراري السابق شرحه في بداية 
هذه الوحدة وستتكون من احدى عشر إجراء تكراري تقابل مباشرة القواعد النحوية السابقة حيث يوجد 
إجراء للرمز اللانهائي ععمعuومك-۲‏ 5 و آخر للرمز غ”عمصهاهك وخمسة إجراءات تقابل 
مستويات الأولويات الخاصة بالتعبير الرياضي. وليس من الضروري إعداد إجراءات مستقل للرموز 
اللانهائية التي تمتل العمليات ويكتفي بالتعرف عليها كجزء من التعبير المرتبطة به ونفس الشيء بالنسبة 
للرمز اللانهائي ۳ه عه۴ حيث أنه مجرد تتابع من الأوامر والذي يمثلها الرمز Stmt - Sequence‏ 
الذي يمثله إجراء بالفعل وبالتالي فإن وحدة الإعراب الخاصة باللغة الإفتراضية تبدا باستدعاء ذلك 
الإجراء مباشرة. 


ووحدة الإعراب تتضمن أيضا المتغير لهعه)هه] الذي يحتفظ بالمفردة الحالية أثناء تحليل الصيغ 
النحوية وكذلك الإجراء اهم لتنفيذ التطابق مع مفردة محددة على أن يقوم باستدعاء ")0 آ†مG‏ 
في حالة حدوث هذا التطابق للحصول على المفردة التاليه والا فإنه يظهر رسالة خطا باستخدام اجراء 
خاص لذلك وليكن Syntax Error 4al‏ الذي يقوم بطباعة رسالة الخطأ. 


وتبدأ عملية الإعراب بتخزين أول مفردة بملف المدخلات داخل المتغير 2Qع۸ة‏ )هم1 ثم يتم استدعاء 
الإجراء مء" عمuوم؟‏ - St"‏ الذي يقوم باختبار نهاية ملف المدخلات قبل إرجاع شجرة النحو الذي تم 
بناءها والتی یمکن اعداد اجراء خاص لطباعة نسخة خطية منها. 

لعفا من الاخطاة 


إن رد فعل وحدة الاعراب تجاه الأخطاء النحوية ( ٤٣۵۲‏ ×ه†"ر6) والتي تقاس بمدى قدرة وحدة 
الإعراب على الإستعفاء من الاخطاء ( ۷ام۷معمR‏ ٣همع)‏ تعتبر غالبا من العوامل الأساسية التي 
تحدد مدى امكانية استخدام المترجم والحد الأدنى عند تحليل الصيغ النحوية هو تحديد هل البرنامج سليم 
من الناحية النحوية أم لا وذلك من طريق تميز سلاسل الحروف للغة خالية السياق التي يتم اشتقاقها من 
القواعد النحوية الخاصة بلغة البرمجة المكتوب بها البرنامج وفي حالة وجود بعض الأخطاء النحوية في 
البرنامج فإنه لا بد أن يشير لمثل هذه الأخطاء. 


وبجانب هذا الحد الأدنى المطلوب من عملية تحليل الصيغ النحوية فإن هناك عدة مستويات لرد الفعل 
تجاه هذه الأخطاء وعموما تحاول وحدة الإعراب أن تعطى رسالة خطأً واضحة على الأقل لأول خطاً 
يتم اكتشافه مع محاولة تحديد مكان حدوث الخطأً بقدر الامگان و طن رخات الإعراب تذهب بعيدا 
بمحاولة إيجاد طريقة لتصحيح الخطاً الذي تم اكتشافه بشكل أو بآخر ولكن في الواقع هذا لا يمكن إلا في 
حالة الأخطاء البسيطة والشائعة وخلاف ذلك فإن أغلبية المحاولات لا تكون ذات كفاءة عالية وتختلف 
كثيرا عما كان ينوي المبرمج القيام به ولهذا فإن مهمة تصحيح الأخطاء نادرآ ما تقوم بها وحدة 
الإعراب ولكن في الواقع تكون هناك صعوبة لتوليد رسالة خطأ واضحة دون الخوض في محاولة 
تصحيح هذا الخطأ. 

وعموما فإن أغلب أساليب الاستعفاء من الأخطاء تكون فردية ولا يمكن تعميمها بمعنى أنها مرتبطة 
بلغة برمجة محددة وخاصة بخوارزمية إعراب محددة مع العديد من الحالات الخاصة لمواقف منفصلة 
مع صعوبة وجود مبادئ عامة ولكن مع ذلك هناك بعض النقاط الهامة التي يتم أخذها في الإعتبار عادة 
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1- إن وحدة الإعراب يجب أن تحاول إكتشاف الخطأ مبكرا بقدر الإمكان لأن التأآخير في ذلك يؤدي إلى 
صعوبة تحديد نوع ومكان حدوث هذا الخطاً. 


2- بعد حدوث الخطأً يجب على وحدة الإعراب أن تحدد المكان المحتمل لإستكمال عملية الإعراب حتى 
يمكن إعراب أكبر جزء من البرنامج بقدر الإمكان وذلك من أجل إكتشاف العديد من الأخطاء الحقيقية 


3- يجب على وحدة الإعراب أن تتفادى مشكلة تتابع الأخطاء (عملةعءه٤‏ ۲ه٣٣ع)‏ والتي تحدث عندما 
يتتبع حدوث خطاً معين سلسلة من الرسائل المرتبطة بنفس الخطأ. 


4- يجب على وحدة الإعراب تفادي الدوائر اللانهائية من الأخطاء (Infinite Loops)‏ والتي تحدث 
تتابع غير منتهي من رسائل الأخطاء دون وجود مدخلات جديدة. 


وبعض الأهداف السابقة تتعارض مع بعضها البعض لذلك فإن القائم بإعداد أي مترجم لا بد أن يأخذ هذا 
في الحسبان عند بناء الجزء الخاص بالتعامل مع الأخطاء. 
تحليل الدلالات 


Semantic Analysis 


إن خصائص تراكيب لغات البرمجة تختلف اختلافا كبيرا من لغة إلى أخرى في المعلومات التي 
تحتوي علیها ومدی تعقيدها وأيضا في الوقت الذي يتم تحديدها فيه وهل هو أثناء مراحل ترجمة 
البرنامج أم تشغيله وعموما فإن ما يلي أمثلة معتادة لمثل هذه الخصائص: 


- نوع بیانات 1 تغد 
- قيمة التعبير. 
- موقع المتغير في ذاكرة الحاسب. 
- شفرة الإجراء بعد الترجمة. 
- عدد الأرقام في العدد. 

وتلك الخصائص قد تكون ثابتة أثناء عملية الترجمة أو تمثل الحد الأدنى أو الأقصى فمثلاً أرقام 
العدد قد يكون عددها ثابت أو يكون له حد أدنى أو أقصى حسب تعريف لغة البرمجة. وأيضا يمكن أن 
يكون تحديد قيمة الخصائص فقط أثناء التنفيذ مثل تحديد قيمة التعبير الذي يحتوي على متغيرات أو 
تحدید موقع تراكيب البيانات ذات التخصيص المتحرك ) اlنnتغير‏ ( ) (Dynamic Allocation‏ وعموماً 
فان عملية حساب أي خاصية وإلحاق قيمتها المحسوبة بتركيبة اللغة هو ما يطلق عليه ال عہ لہا8 
الخاص بالخاصية. وتوقيت حدوث ذلك يسمى ال ( eص¡ا‏ ع" )Bindi‏ والذي يكون مختافا بالنسبة 


للخصائص المختلفة ولنفس الخاصية قد يكون مختلفا من لغة برمجة إلى أخرى. وإذا كان يتم أثناء عملية 
الترجمة وقبل البدء في التنفيذ تسمى الخاصية خاصية ساكنة ) (Static Attributes‏ أما إذا کان خلاف 
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ذلك فيطلق عليھا خاصية متحركة ( عutںطا٣٤اA‏ icصهمر0)‏ وبالطبع فإن معدي المترجمات يهتمون 
EC EO‏ 


والآن وعند النظر لأمثلة الخصائص السابقة لمعرفة توقيت تحديد كل منها ومدى أهمية ذلك أثناء 
عملية الترجمة نجد ما يلي: 


- في لغات البرمجة التي يتم فيها تحديد النوع بشكل ساكن مثل لغة السي وال اهعءءهم فإن نوع بيانات 
المتغير يعتبر أحد الخصائص الساكنة الهامة وعملية اختبار النوع (ع٠‏ )عمط ممرآ) تتم أثناء مرحلة 
تحليل الدلالات حيث يتم تحديد قيمة خاضية نوع البيانات لكل مكونات اللغة التي يتم تعريف نوع بياناتها 
والتحقق منها وفقا لقواعد اللغة. ولكن في لغة مثل ال مءا والتي يتم فيها تحديد أنواع البيانات بشكل 
متحرك فإن المترجم يكون عليه توليد شفرة لتحديد الأنواع واختبارها أثناء تنفيذ البرنامج. 


- أن قيم التعبيرات عادة ما تكون متحركة حيث يقوم المترجم بتوليد شفرة لحساب تلك القيم أثناء تنفيذ 
البرنامج ولكن بعض التعبيرات التي تحتوي على قيم ثابتة فقط ( متثل 3 + 4 * 5 ) فان محلل الدلالات 
يختار حسابها لإيجاد قيمة التعبير النهائية أثناء الترجمة. 


- أن تخصيص موقع المتغيرات في الذاكرة أما أن يكون ساكن أو متحرك وذلك حسب اللغة وصفات 
المتغير ذاته فمثلاً في لغة ال ۴0۴۴۱۸ فإن تخصيص جميع المتغيرات يكون ساكن بينما في لغة ال 
مزا يكون تخصيص جميع المتغيرات متحركا. أما في لغة ال ° وال اهعءهم فإن تخصيص المتغيرات 
يكون خليطا بعضها ساكن والبعض الآخر متحرك حسب نوع المتغير وعادة ما يؤجل المترجم 
الحسابات المرتبطة بتخصيص المتغيرات حتى مرحلة توليد شفرة الهدف حيث أن تلك الحسابات ترتبط 
ببيئة تشغيل البرنامج وتفاصيل الحاسب المستهدف. 


- إن شفرة الهدف لأي إجراء هي بالتأكيد أحد الخصائص الساكنة وتوليد شفرة الهدف هي مرحلة 
المترجم المعنية بهذه الخاصية. 


- إن عدد أرقام العدد هي أحد الخصائص التي غالبا ما يتم معالجتها بشكل ضمني أثناء عملية الترجمة 
وذلك لكونها مرتبطة بطريقة تمثيل القيم والذي عادة ما يكون جز ءا من بيئة تشغيل البرنامج ولكن محلل 
المفردات قد يحتاج إلى معرفة عدد الأرقام المسموح بها لكي يكون العدد صحيح. 


وكما شاهدنا من الأمثلة السابقة فإن حسابات الخصائص تختلف بشكل كبير وعندما تظهر في المترجم 
فإن ذلك قد يحدث في أي وقت آثناء عملية الترجمة ولكن مع ذلك يتم ربط حسابات الخصائص بمرحلة 
تحليل الدلالات على الرغم من كون بعض الخصائص يكون هناك احتياج لمعلومات عنها أثناء مرحلة 
تحليل المفردات أو مرحلة تحليل الصيغ النحوية وسوف نركز فقط في هذه الوحدة على حسابات 
الخصائص التي تتم بعد الانتهاء من الإعراب وقبل البدء في توليد شفرة الهدف من المترجم 

1 القواعد الخصائصية 


إن الخصائص ترتبط مباشرة برموز القواعد النحوية الخاصة باللغة سواء الرموز النهائية أو 
اللانهائية فإذا كان × هو أحد هذه الرموز و ۾ هي إحدى الخصائص المرتبطة ب × فإننا نكتب ۾.× 
للتعبير عن قيمة الخاصية ج المرتبطة بالرمز × . وطريقة الكتابة هذه تشابه الطريقة المستخدمة في 
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التعبير عن حقول السجلات في لغة ال اجعیجم وعناصر التراكيب (عإں†uczں٣†؟5)‏ في لغة السي وذلك 
على الرغم من أن الطريقة المعتادة لتطبيق حسابات الخصائص هو وضع قيمة الخصائص داخل عقد 
شجرة النحو باستخدام حقول السجلات أو عناصر التراكيب كما سيتضح في هذا الجزء. 

وعادة ما يتم كتابة القواعد الخصائصية بحيث يكون مع كل قاعدة نحوية القاعدة أو القواعد الدلالية 
المرتبطة بها كما في الشكل التالي: 

Grammar Rule ةيgحill القاعدة‎ Semantic Rules ةıl¥دلl القواعد‎ 


القواعد الدلالية المرتبطة بالقاعدة الأولى القاعدة الأولى 1 عاںR‏ 


القواعد الدلالية المرتبطة بالقاعدة الثانية القاعدة الثانية 2 Rule‏ 


القواعد الدلالية المرتبطة بالقاعدة الأخيرة القاعدة الأخيرة Rule n‏ 


ولأننا سبق أن شرحنا القواعد الخصائصية بالتفصيل في الوحدة الثانية من هذه المادة العلمية لذلك سنقدم 
مباشرة بعض الأمثلة الإضافية لتلك القواعد: 


مثال 1 


بفرض القواعد النحوية البسيطة التالية والخاصة بالأعداد الصحيحة بدون الإشارة: 


number number digit | digit 


digit 0| 1| 2| 3| 4| 5| 6| 7| 38|9 


فإن أهم خاصية للعدد هي قيمته والتي سنعطيها الاسم اه وكل رقم له قيمة تتوافق مباشرة مع الرقم 
الفغلى الذي بمظه فف القاعدة النحرية 3 اوا تعتى أن -الرق له الفيمة 3 فى هذه الخالة وهر ها يمكن 
التعبير عنه بالقاعدة الدلالية: 


digit.val = 3‏ 
لذلك سنربط تلك القاعدة الدلالية بالقاعدة النحوية 3 اعا ونفس الشيء بالنسبة لباقي الأرقام وكذلك 
بالنسبة للأعداد فكل عدد له قيمة حسب الأرقام التي يحتوي عليها فإذا كان العدد يشتق باستخدام القاعدة 


النحوية 
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number digit 


فإن العدد يتكون في هذه الحالة من رقم وحيد وبالتالي فإن قيمته هي قيمة هذا الرقم والقاعدة الدلالية التي 
تعرض هذه الحقيقة تكون كما يلي : 


number.val = digit.val 


أما إذا كان العدد يحتوي على أكثر من رقم فإنه يشتق باستخدام القاعدة النحوية: 

number number digit 

ومن الضروري توضيح العلاقة بين قيمة الرمز الموجود في الجانب الأيسر من القاعدة النحوية وقيم 
الرموز التي تظهر في الجانب الأيمن من القاعدة النحوية مع ملاحظة أن الرمز ۲٥ط‏ ںم يظهر مرتان 
في القاعدة النحوية لذلك يجب التفرقة بينهما لأن قيمة الرمز ۲عطمںم الذي في الجانب الايمن سوى 


الأيسر وسنفرق بين الاثنين باستخدام الترقيم وسنعيد كتابة القاعدة النحوية لتصبح كما يلي: 


number1 number2 digit 


وبافتراض عدد مثل 34 فإن الاشتقاق من أقصى اليسار لهذا العدد يكون كالآتي: 


number number digit digit digit 3 digit 34 


وبفرض استخدام القاعدة النحوية الأخيرة في أول خطوات الاشتقاق فإن الرمز اللانهائي 2عماصںم 
سيقابل الرقم 3 بينما الرمز اللانهائي اعا سيقابل الرقم 4 وستكون القيمة التي تقابل كلا منهما هي 3 
و 4 على التوالي. وللوصول إلى قيمة الرمز ۲1٥طںم‏ يجب ضرب قيمة الرمز 2١٣عاصںم‏ في 10 
ثم إضافة قيمة الرمز اعا وذلك كما يلي : 


number1.val = 3 * 10 + 4 = 34 


بمعنى ترحيل القيمة 3 خانة عشرية واحدة جهة اليسار مع إضافة القيمة 4 وهذا يقابل القاعدة الدلالة 
التالية: 
number1. val = number2. val * 10 + digit‏ 
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وبالتالي نصل إلى القواعد الخصائصية التالية للخاصية اج : 
ومعنى القواعد الدلالية لسلسلة محددة من الأرقام يمکن توضيحه أكثر باستخدام شجرة الإعراب فمتلاً 


شجرة الإعراب الخاصة بالعدد 345 تكون كما يلي : 


ومعنى القواعد الدلالية لسلسلة محددة من الأرقام يمكن توضيحه أكثر باستخدام شجرة الإعراب فمثلا 
شجرة الإعراب الخاصة بالعدد 345 تكون كما يلي: 


وفي الشكل السابق نلاحظ أن الحسابات التي تقابل القواعد الدلالية المحددة تظهر تحت العقد الداخلية 
من شجرة الإعراب وعرض القواعد الدلالية كحسابات في شجرة الإعراب يكون هاما بالنسبة 
مثال 2 
بفرض القواعد النحوية التالية الخاصة بالتعبيرات الرياضية البسيطة: 
exp exp + term | exp El term | term‏ 
term term * factor | factor‏ 


factor ( exp ) | number 


والخاصية الأساسية للرموز اللانهائية م×ع و k۳"‏ و ٣ه†ءه؟‏ هي قيمتها الرقمية والتي يمكن أن تكتب 
اه۷ لتصبح القواعد الدلالية المرتبطة بالقواعد النحوية كما يلي: 


والقواعد الدلالية السابقة تظهر العلاقة بين الصيغ النحوية للتعبيرات الرياضية وبين الدلالات الخاصة 
للحسابات الرياضية الواجب إنجازها ويلاحظ عدم وجود قاعدة دلالية يظهر فيها اج۷.١۴عما‏ ۳نم في 
لجاب الاعرن لامها ن ررر جا ا هو الحا فل اى فان ی يك ان ها 
وليكن ذلك فى مرحلة تحليل المفردات: والحل الآخر 'البديل لذلك هو إضنافة قواعد نخوية وقو اع دلالية 
(مثل الموضحة في المثال السابق) تمكن من حساب قيمة تلك الخاصية. 


والآن نستطيع أن نظهر الحسابات الخاصة بتلك الخاصية عن طريق إضافة معادلات القواعد الدلالية 


لعقد شجرة الإعراب وبغرض التعبير الرياضي (34 - 3) * 42 فإننا يمكن توضيح دلالات قيمة هذا 
التعبير باستخدام شجرة الإعراب التالية: 
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مثال 3 


بفرض القواعد النحوية التالية والخاصة بتعريف المتغيرات (۸٥ااة۲هاءم0‏ كعاطهاا۷a)‏ في لغة السي 
مع بعض التبسيط: 


decl type varBlist 
type int | float 
varBlist id, varBlist | id 


ونريد تحديد نوع البيانات ( مم۷ هة0) كخاصية مصاحبة للمتغيرات التي تم تقديمها من خلال 
المعرفات ( ١٣ء‏ مه|ا) في القواعد النحوية السابقة مع كتابة القواعد الدلالية التي تحدد كيف تكون 
تلك الخاصية مرتبطة بنوع التعريف الخاص بالمتغيرات. وسنقوم بذلك من خلال إعداد القواعد 
الخصائصية المتعلقة بالخاصية dtype‏ ) التي بالطبع تختلف عن الرمز اللانهائي type‏ في القواعد 
النحوية ) حيث ستكون تلك القواعد الخصائصية كما يلي: 


ونلاحظ في القواعد الدلالية السابقة أن قيمة الخاصية عممرال هي إما #۲عها| أو اهم والتي تقابل 
المفردات ¡١‏ و خهها؟ على التوالي وأن الرمز اللانهائي ممع له أيضا قيمة للخاصية عمرال يتم 
تخدوها اد اع رة الي سا وه الق هي الت تد فت لكام لفن الو ت الى 
يعبر عنها بالرمز اللانهائي tءاا-‏ ه٠‏ وهو ما يتضح من القاعدة الدلالية المصاحبة للقاعدة النحوية 
الخاصة بالرمز اللانهائي اعم كما أن قيمة الخاصية عممرال لكل ل¡ في قائمة المتغيرات tءاا-٣2ر‏ 
تحدد وفقا لقيمتها لدى قائمة المتغيرات tءاا-۲‏ ج نفسها كما يلاحظ أن الرمز اللانهائي اعم ليس لديه 
الخاصية ممرال لعدم الاحتياج لذلك وهو ما يعني عدم ضرورة إلحاق أي خاصية بجميع الرموز 
النهائية واللانهائية التي تحتوي عليها القواعد النحوية. 


وكالسابق نقدم الآن شجرة الإعراب التي تعرض القواعد الدلالية بفرض أن سلسلة المدخلات كما يلي: 


float x,y 


فان شجرة الإعراب الخاصة بها ستكون كالتالي: 


ويلاحظ أن جميع الأمثلة السابقة كانت تحتوي على خاصية واحدة فقط ولكن ذلك ليس ضروريا في 
جميع الحالات. فقد تتضمن القواعد الخصائصية عدة خصائص مترابطة في نفس الوقت. والمثال التالي 
يقدم حالة بسيطة تحتوي على عدة خصائص يربط بينها علاقة. 
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مثال 4 


بفرض إجراء تعديل على القواعد النحوية الخاصة بالأعداد الصحيحة والتي سبق استخدامها في المتثال 
رقم ) 1( 1) وهذا التعديل يسمح بأن يكون العدد إما عدداً عشرياً (Decimal)‏ 3 عدداً ثمانیا (Octal)‏ علی 
أن يتم تحديد ذلك باستخدام حرف واحد يلي العدد فإذا كان الحرف م فهذا يعنى أن العدد ثماني أما إذا 


كان الحرف فهذا يعني أن العدد عشري وعند ذلك فإن القواعد النحوية ستكون كالآتي: 
based-num num basedchar‏ 

basedchar o | d 

num num digit | digit 


digit 0| 1| 2|3| 4| 5| 6| 7| 8|9‏ 
الخ ازز سات الخاصة بكمات الخضانط 


في هذا الجزء سندرس طرق استخدام القواعد الخصائصية كأساس للمترجم عند حساب واستخدام 
الخصائص المعَّرفة بواسطة القواعد الدلالية والتي تقوم على تحويل تلك القواعد الدلالية إلى إجراءات 
حسابية وعند النظر إلى المعادلة التي تمثل كل قاعدة دلالية على كونها أمر تخصيص لقيم الخصائص 
الموجودة في الجانب الأيمن للأمر إلى الخاصية الموجودة في الجانب الأيسر فان نجاح هذا الأمر 
يتطلب أن تكون جميع الخصائص التي تظهر في الجانب الأيمن قد سبق حسابها من قبل ولكن هذا 
المطلب يتم إهماله في القواعد الخصائصية وذلك لأن معادلات القواعد يمكن أن يتم سردها بأي ترتيب 
دون أن يؤّثر ذلك على صحتها. ولهذا فان المشكلة الأساسية عند إعداد الخوارزمية المقابلة للقواعد 
الخصائصية تكمن في إيجاد ترتيب سليم لتطبيق معادلات القواعد الدلالية الذي يضمن نجاح أوامر 
التخصيص المقابلة لتلك المعادلات بحيث تكون جميع قيم الخصائص المستخدمة في الحسابات متوفرة 
عند إنجاز تلك الحسابات وعموما فان المعادلات تحدد شروط الترتيب المناسب لإجراء الحسابات 
الخاصة بالخصائص التي تحتوي عليها لذلك فإن المهمة الأولى هي إظهار تلك الشروط المتعلقة 
بالترتيب وذلك باستخدام أحد المخططات الموجهة ( إمةا6 لام0 ) والتي تسى مخطط 
الإعتlnدıة‏ ) Dependency Graph‏ (. 


2.. المخططات الإعتمادية والترتيب 

إن كل اختيار في القواعد النحوية التي تشملها القواعد الخصائصية يكون له مخطط اعتمادي مرتبط 
به وهذا المخطط يحتوي على عدة عقد وكل عقدة منهم تكون معنونه بكل خاصية زه.¡× لكل رمز نهائي 
أو لانهائي في تلك القاعدة النحوية بالإضافة إلى أن لكل معادلة بالقواعد الدلالية على الشكل : 
(,xm.ak, )Xi.aj = fij‏ 
مرتبطة بهذه القاعدة النحوية يكون هناك رابط ( معلم) من كل عقدة )ه."× في الجانب الأيمن 
للمعادلة الدلالية إلى العقدة زه.¡× وهذا الرابط هو الذي يوضح أن الخاصية زه.¡× تعتمد على خاصية 


).× وبالتالي فلا بد أن يتم حساب قيمة الخاصية )ه. × حتى يمكن حساب قيمة الخاصية زه.¡× 
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ا کان ی ت جروا ق ا ن و ا ا کن 
مخطط اعتمادي يتكون من اتحاد المخططات الإعتمادية لاختيارات القواعد النحوية التي تمثل جميع عقد 
شجرة الإعراب الخاصة بسلسلة الحروف. 

وعند رسم المخطط الإعتمادي لكل قاعدة نحوية أو لسلسلة الحروف فإن العقد المرتبطة بكل رمز × يتم 
رسمها في مجموعات بحيث تظهر الروابط كهيكل حول شجرة الإعراب وهذا ما سنوضحه من خلال 
الأمثلة التالية. 

مثال 5 

بفرض القواعد النحوية التي في المثال رقم (1) مع القواعد الخصائصية التي تم إعدادها في ذلك المثال 
والتي كانت تتضمن على خاصية وحيدة وهي اهر لهذا فإن كل رمز نهائي أو لا نهائي يكون له مخطط 
اعتمادي يتكون من عقدة واحدة تمتل تلك الخاصية مع هذا الرمز فمتلا القاعدة النحوية: 

number1 > number2 digit 


لها قاعدة دلالية واحدة مرتبطة بها وهي: 

number1.val = number2.val * 10 + digit.val 

لذلك فإن المخطط الاعتمادي لهذه القاعدة النحوية يكون كالآتي: 

و بنفس الطريقة فإن المخطط الاعتمادي للقاعدة النحوية †أعال + إعطص"ںم يكون كمايلي: 


وبالنسبة لباقي القواعد النحوية فإن المخططات الاعتمادية الخاصة بها ستكون في غاية البساطة لكونها 
لا تحتوي على أي روابط لكون حساب قيمة الخاصية اهر.٤أعاك‏ سيتم مباشرة من الجانب الأيمن لكل 
قاعدة نحوية. 


وفي النهاية فإن المخطط الاعتمادي الخاص بالعدد 345 سيكون الآتي: 

وهذا المخطط الأخير هو ما يقابل شجرة الإعراب الخاصة بهذا العدد والتي تم تقديمها في المتثال رقم 
)1( 

مثال 6 


بفرض القواعد النحوية في المقال رقم 3 والقواعد الخصائصية التي تم إعدادها والمتعلقة بالخاصية 
dtype‏ وكانت القاعدة النحوية: 
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var- list1 2 id , varBlist2 
یرتبط بها قاعدتین دلالیتین هما:‎ 
id-dtype = var-list1.dtype 


var-list2.dtype = var-list1.dtype 


لذلك فإن المخطط الاعتمادي لها سيكون كما يلي: 

وبنفس الطريقة فإن المخطط الاعتمادي للقاعدة النحوية 4¡ < اءاا-۲ ه۷ سيكون كالتالي: 

بينما المخطط الاعتمادي لكل من القاعديتن ادها؟ ج عمرا , ا"¡ عمرا فسيكونان في غاية البساطة 
لعدم وجود روابط بهما وفي النهاية فإن المخطط الاعتمادي للقاعدة النحوية: 

decl 2 type varBllist 

والتي يرتبط بها القاعدة الدلالية: 

var-list.dtype = type.dtype 

سيکون كما يلي: 

وفي هذه الحالة الأخيرة ولكون الرمز اللانهائي اعم لا يظهر في المخطط الإعتمادي فإن ارتباط ذلك 
المخطط بالقاعدة النحوية يكون غير واضح ولهذا السبب ولعدة أسباب أخرى فإن المخطط الاعتمادي 
غالبا ما يتم رسمه حول جزء شجرة الإعراب المتعلق بالقاعدة النحوية وبالتالي فإن المخطط الاعتمادي 
السابق یمکن أعادة رسمه كالتالي: 

وهو ما يجعل القاعدة النحوية التي يرتبط بها المخطط الإعتمادي واضحة ولكن يلاحظ عدم كتابة 
الخاصية مع الرمز اللانهائي بالشكل المعتاد في هذا الوضع الأخير للمخطط الإعتمادي بل يتم كتابة 
الخاصية بجوار العقدة التي تمثل الرمز اللانهائي وبالتالي فإن المخطط الاعتمادي الأول في هذا المتال 
عند إعادة رسمه مع شجرة الإعراب سيكون كما يلي : 


وفي النهاية فإن المخطط الاعتمادي لسلسلة الحروف ‏ ,× ۴|٠۵٤‏ سيكون كالشكل التالي: 
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مثال 7 

بفرض القاعدة النحوية التي في المثال رقم 4 مع القواعد الخصائصية المتعلقة بالخاصيتين اها ,هوهط 
وسوف نقوم برسم المخططات الإعتمادية لأربعة قواعد نحوية فقط هي: 

based-num 32 num basechar 

num 2 num digit 

num 2 digit 


digit > 9 


ونبد بالمخطط الإعتمادي للقاعدة النحوية الأولى والتي سيكون كما يلي: 


وهذا المخطط السابق يمتل القاعدتين الدلاليتين المرتبطتين بالقاعدة النحوية الأولى أما القاعدة 
النحوية الثانية فإن المخطط الاعتمادي الخاص بها سيكون كالتالي: 


والمخطط الإعتمادي للقاعدة النحوية الثالثة فإنها سيكون كما يلي: 


وأخيرا سيكون المخطط الإعتمادي للقاعدة النحوية الأخيرة كالأتي : 
وعند رسم المخطط الاعتمادی للعدد 3450 فانه سيكون كمايلى: 


وبفرض أننا نريد الآن تحديد الخوارزمية التي تقوم بحساب خصائص القواعد الخصائصية باستخدام 
معادلات القواعد الدلالية كقواعد حسابية في سلسلة المفردات المحددة والمراد ترجمتها سيقوم المخطط 
الإعتمادي لشجرة الإعراب الخاص بها بتحديد قيود الترتيب التي يجب أن تتبعها الخوارزمية لكي تتمكن 
من حساب خصائص تلك السلسلة من المفردات وبالطبع فإن أي خوارزمية يجب أن تقوم بحساب قيمة 
الخاصية في كل عقدة من عقد المخطط الإعتمادي قبل أن تحاول حساب قيمة الخاصية التي تليها فى 
ترتيب الاعتمادية فلابد ان يتم حساب الخاصية هج قبل الخاصية زج إذا كانت الخاصية زه تعتمد على 
الخاصية زه وترتيب التنقل في المخطط الإعتمادي هو الذي يحدد قيود الترتيب التي يجب أن تلتزم بها 
الخوارزمية وعموما ولكي ينجح ذلك فإنه لابد ألا يكون هناك أي دورات في المخطط الإعتمادي أي 
يشترط في المخطط أن يكون مخططا موجهاً لا دائرياً (٣مةا‏ ءااءرAc‏ dمctمءء0i)‏ والذي یعرف 
بالاسم المختصر 0۸6 . 
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مثال 8 


إن المخطط الاعتمادي الذي في المتال السابق والخاص بالرقم 3450 هو مخطط من النوع 0۸6 وسيتم 
ترقيم العقد التي يحتوي عليها وفقا لترتيب التنقل الذي يمكن أن يتبعه الخوارزمية في حساب قيمة 
الخصائص حيث سيكون المخطط الإعتمادي كما يلي بعد الترقيم مع حذف شجرة الإعراب من أجل 
سهولة الرؤية : 


ويجب التأكيد على أن ترتيب التنقل الذي يوضحه ترقيم العقد في الشكل السابق ليس هو الترتيب 
الوحيد للتنقل الذي يجب أن تلتزم به خوارزمية حساب الخصائص فيمكن أيضا التنقل داخل المخطط 
الإعتمادي السابق بالترتيب التالي من اليمين إلى اليسار : 


12 6 9 1 2 11 3 8 4 5 7 10 13 14 


وكما شاهدنا فإنه من الممكن أن تعتمد الخوارزمية الخاصة بتحليل الخصائص على بناء المخطط 
الإعتمادي أثناء الترجمة بحيث يحدد ترتيب التنقل داخل المخطط الترتيب الذي يتم به حساب الخصائص 
ولأن بناء المخطط الإعتمادي يقوم على شجرة إعراب محددة في وقت الترجمة لذلك يطلق على هذه 
الطريقة في بعض الأحيان طريقة شجرة الإعراب (١هط†ع“™‏ عء۲۲ مءج۴) وهذه الطريقة ليست هي 
الطريقة الوحيدة لحساب قيم الخصائص التي تتضمنها القواعد الخصائصية فهناك طريقة أخرى بديلة 
تعرف بالطريقة القائمة على القواعد (١0ط†ع“‏ 4ءءه8B‏ -م|إں۸) وهذه الطريقة الأخيرة تعتمد على قيام 
معد المتزجم بتطيل القراعد 'الخضائصية التحديد تر تيب مناست لخساب قي الخضائض التي تحثوى 
عليها القواعد الخصائصية. هذا الترتيب هو الذي سيستخدم عند بناء المترجم وعموما فإن تحديد الترتيب 
المناسب يتوقف على نو عية الخصائص المطلوب حساب قيمتها وهذا هو موضوع الجزء القادم. 
الان اة وال و ا 


إن حساب قيمة الخصائص القائم على تحليل القواعد النحوية يعتمد أيضا على ترتيب التنقل داخل 
شجرة الإعراب أو شجرة النحو وهذا الترتيب يختلف حسب نوع ارتباط الخصائص ببعضها البعض 
ری ف ر ن و ا و ا ال ا ر و 
بالنوع الأول البسيط والذي تتميز به الخصائص المصنعة ( )Synthesized Att ٣|طں ts‏ حیث تعتبر 
الخاصية مصنعة إذا a‏ الإعراب من أسفل إلى أعلى أي من الابن إلى 
الأب فإذا كانت القاعدة النحوية على الشكل التالي: 


A3 X1X2X3...Xn 


فلابد أن تكون جميع معادلات القواعد الدلالية المرتبطة والتي تظهر فيها الخاصية ج في الجانب الأيسر 
من المعادلة على الشكل الآتي: 


(A.a = F(X1.a1,...,X1.ak,..., Xn.a1..., Xn.ak 
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لكي تكون تلك الخاصية ج مصنعة ونحن بالفعل شاهدنا e‏ علی خصائص 
TEE‏ هذا ا الانتهاء من بناء شجرة الإعراب 
ا النحو في مرحلة تحليل الصيغ النحوية فإنه يمكن حساب قيم ذلك النوع من الخصائص اء 
التنقل مرة واحدة من اأسفل إلى أعلى داخل الشجرة أو التنقل ذو الترتيب اللاحق ( Postorder‏ 
(Traversal‏ أتلك الشجرة وهذا ما يوضحه شفرة الإجراء التكراري التالي : 

(procedure PostEval (T : treenode 

begin 

for each child C of T do 

;(PostEval(C 


,compute all synthesized attributes of T 


;end 


وبالطبع ليست جميع الخصائص مصنعة فهناك أيضا الخصائص الموروثه ) (Inherited Attributes‏ 
وهي تلك الخصائص التي لا تتوفر فيها الشروط السابقة للخصائص المصنعة وقد شاهدنا أيضا ف 
الأمتة السافة يعن المساشن المرر وة مث الكاصدة مورا فى الفقل رك ( ى و كلك الخاضة 
مط في المثال رقم (4) وهذا النوع من الخصائص يكون فيه الارتباط من أعلى إلى أسفل في شجرة 
الإعراب أي من الأب إلى الابن أو يكون ألارتباط بين الأبناء المشتركين في نفس الأب ويمكن توضيح 
هذين النوعين من الارتباط بالشكلين التاليين: 


وهذان النوعان من الإرتباط موجودان في الخاصية عممرا في المتال رقم (6) وعموما فإن الخصائص 
الموروثة يمكن حساب قيمتها بالتنقل أيضا داخل شجرة الإعراب أو شجرة النحو ولكن في هذه الحالة 
بالتنقل ذو الترتيب السابق (ا2ء۲٥۷ه٣۲‏ ۲عل٣هه۴۲)‏ وشفرة الإجراء التكراري التالي توضح ذلك : 
(procedure PreEval (T : treenode‏ 

begin 

for each child C of T do 

;,compute all inherited attributes of C 


;(PreEval(C 


;end 
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وعلى عكس الخصائص المصنعة فإن ترتيب حساب الخصائص الموروثة عند الأبناء مهم وذلك 
لإمكانية وجود ارتباط بين خصائص تلك الأبناء كما أوضحنا في السطور السابقة لذلك لا بد أن يكون 
حساب الخصائص الموروثة لدى الأبناء متناسب مع حالة الارتباط بينهم. 
3. جدول الرموز 


يعتبر جدول الرموز (عاطاة۲ امطصر؟ ) أهم الخصائص الموروثة في المترجم كما أنه أهم تراكيب 
البيانات المستخدمة بعد شجرة النحو وعلى الرغم من تأجيل شرح جدول الرموز إلى هذه المرحلة 
الخاصة بتحليل الدلالات الا انه يجب التاكيد أن جدول الرموز متضمن أيضا فى المراحل السابقة لهذه 
المرحلة حيث يظهر دوره الفعال في مرحلة تحليل الصيغ النحوية وكذلك مرحلة تحليل المفردات سواء 
عند الاحتياج لإضافة بيانات إلية او عند استشارته لحل الغموض الذى يحدث فى بعض الحالات. ومع 
هذا وفي حالة لغات البرمجة المصممة بدقة شديدة مثل لغة ال اهعءجم ولغة ال هك فإنه قد يتم تأجيل 
التعامل مع جدول الرموز لما بعد الانتهاء من تحليل الصيغ النحوية وعند التأكد من أن البرنامج 
المطلوب ترجمته سليم نحويا وهذا بالفعل ما تم بالنسبة للغة الافتراضية التي سيتم دراسة جدول الرموز 
الخاص يها في نهاية الوحدة. 


وعموما فإن لجدول الرموز ثلاثة عمليات أساسية هي الإضافة (۲۲٠ء١|)‏ والبحث (مں‌)هها) والحذف 
(#ا#ام5) هذا بالإضافة إلى بعض العمليات المساعدة الأخرى وغملية الإضافة تستخدم لتخزين 
معلومات تم الحصول عليها من خلال تعريفات الأسماء (i0اة٣aاءمD‏ مصهN)‏ . أما عملية البحث 
فنحتاج إليها لاسترجاع المعلومات الخاصة باسم محدد عند ورود هذا الإسم في شفرة البرنامج بينما 
عملية الحذف فيكون الاحتياج لها عندما يصبح تعريف أحد الاسماء ليس له ضرورة. وبصفة عامة فإن 
کا ا العماات اة يخكعا قا عد لحه ار سية المظرت ترحمتا ونالنععة للتطرهات الت وك 
تخزينها في جدول الرموز فهي حسب هيكل الجدول والغرض من التعريفات. ولكن عادة ما تشمل 
معلومات عن نوع البيانات ( ممرآ هاه0) والمدى ( معمهء5 ) الذي يكون خلاله الاسم صالحا 
للاستخدام وكذلك الموقع في الذاكرة (”هاخةءما رممصع") وسوف ندرس في هذا الجزء تنظيم هيكل 
بيانات جدول الرموز وفي النهاية نقدم مثالا شاملا لاستخدام جدول الرموز مع أحد القواعد الخصائصية. 


3 هیکل جدول الرموز 


إن هيكل جدول الرموز متل القاموس وكفاءة عملياته الأساسية ( الإضافة والبحث والحذف ) تختلف 
حسب تنظيم هيكل البيانات الخاص به وعموما فإن تحليل كفاءة التنظيمات المختلفة وفحص الأساليب 
التنظيمية الجيدة تعتبر من الموضوعات الأساسية لمادة هياكل البيانات لهذا فلن نقوم بدراستها بالتفصيل 
في هذه المادة العلمية وسنكتفي بإعطاء نظرة عامة فقط لأهم هياكل البيانات التي تصلح للإستخدام مع 
جدول الرموز عند بناء المترجم والتي تشمل القوائم الخطية (كئاءاا 2۴ع "اا ) وهياكل شجرة البحث ( 
Search re65‏ ) المختلفة مثل شجر البحث الثنائى ( s٥ع۲۲‏ عarمS Binary‏ ) وكذلك الجداول 
العشوائية ( اھ۲ اoمطbصyك‏ ). 


والقوائم الخطية هى إحدى هياكل البيانات البسيطة والجيدة فى نفس الوقت التي يمكنها تنفيذ العمليات 
اللا اا لجرل امون مهرد وارب مار حي ك عي فة راء في بدا ر 
نهاية القائمة في وقت ثابت بينهما عمليتي البحث والحذف فإن الوقت الخاص بها يتوقف على حجم 
القائمة ولهذا فإن القوائم الخطية قد تكون جيدة بشكل كافي لبناء جدول الرموز الخاص بالمترجمات التي 
لا يمثل فيها سرعة الترجمة عنصرا مهما بالنسبة لها مثل المترجمات التجريبية والمترجمات الفورية 
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للبرامج صغيرة الحجم. أما هياكل شجر البحث فهي أقل استخداما بالنسبة لجدول الرموز لكونها ليست 
الأعلى كفاءة بالإضافة إلى تعقيد عملية الحذف. بينما الجداول العشوائية فهي تعتبر أفضل الاختيارات 
لتنفيذ جدول الرموز ذلك لكون جميع عمليات الجدول الأساسية يمكن تنفيذها في وقت ثابت إلى حدِ كبير 
ولهذا فهي تستخدم بكثرة في بناء جدول الرموز. 
3.. التعريفات 

إن أداء جدول الرموز يرتبط بقوة بالصفات الخاصة بالتعريفات ( ك ها†ةهاءم0) في اللغة 
المطلوبة ترجمتها فمتلا كيفية تفعيل عمليتي الإضافة إلى والحذف من جدول الرموز وتوقيت الاحتياج 
لهذه العمليات والخصائص التي تضاف إلى الجدول تختلف كثيرا من لغة إلى أخرى هذا بالإضافة إلى 
أن مرحلة بناء جدول الرموز خلال عملية الترجمة والفترة الزمنية التي نحتاج فيها إلى بقائة قد يختلف 
أيضا من لغة إلى أخرى وفي هذا الجزء سوف نشير إلى بعض النقاط المتعلقة بالتعريفات فى لغة 
البرمجة التى تؤثر على اداء وتنفيذ جدول الرموز وبصفة عامة هناك أربعة أنواع أساسية من التعريفات 
التي تحدت بكثرة في لغات البرمجة وهي تعريفات الثوابت ( "اة ام0٥‏ ntهcons†t)‏ وتعریفات 
الأنواع ( ype Decاlarati0 ns‏ ) وتعريفات المتغيرات ( )Variable Declara†i0s‏ وأیضا 
تعريفات الإجراءات وlلg¡ظlئف (Procedure / Function Declarations)‏ . 
وتعريفات الثوابت تشمل ما يلي في لغة اهءئجم : 


;Const int SIZE = 200 


وتعريفات الأنواع تتضمن الآتي في لغة ال أاهعئج" : 


;, type table = array[18SIZE] of Entry 


وأيضا تعريف اع ٣ء‏ في لغة السي مثل : 
struct entry‏ 

}; char * name 

;, int count 

,struct entry * next 

1 


كما أن لغة السي لديها الأسلوب ملعم را تعريف أسماء بديلة للأنواع مثل: 
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;typedef struct entry * entryptr 


أما بالنسبة لتعريفات ١‏ لمتغيرات وهي أكثر أنواع التعريفات شيوعا في أغلب لغات البرمجة فهي تشمل 
الآتي في لغة FORTRAN JÎ‏ : 


(integer a, b(100 


وكذلك ما يلي في لغة السي: 


;[int a, b[100 


وأخيرا هناك تعريفات الإجراءات والوظائف متل تعريف الوظيفة الآتية في لغة السي : 


(int factorial (int num 


} 

;int fact = 1 

(--for(int i=num; i>=1 ; i 
;fact *= i 

;return fact 


{ 


حيث أنها لا تختلف عن تعريف لثابت من نوع إجراء أو وظيفة ولكن أغلب اللغات ولطبيعته الخاصة 
تعتبره نوعا مستقلاً من التعريفات. 


وجميع أنواع التعريفات تكون واضحة (ءاام×۴) لوجود أمر خاص باللغة تستخدم في تلك التعريفات 
ويمكن أيضا أن تكون التعريفات ضمنية (ءاامم"|) عن طريق إلحاقها بالأوامر التنفيذية كما هو الحال 
في لغة ال اوھط و ۴0۸۲8۸۸ اللتان تسمحان باستخدام المتغيرات بدون تعريف ظاهر وفي هذ الحالة 
الأخيرة فإن الأمر يتطلب بعض الجهد من أجل تجميع نفس المعلومات التي يتم الحصول عليها في حالة 
التعريف الظاهر. ففي لغة ال ۴0۸84١‏ مثلا لديها قاعدة هي أن جميع المتغيرات التي تبدأ بالحروف 
من | وحتى N‏ وليس لها تعريفا ظاهراً تعتبر أنها متغيرات صحيحة (٣هعها,|)‏ أما إذا بدأت بأي 
حروف أخرى فإنها تعتبر متغيرات حقيقية (اa٥۸)‏ وفي بعض الأحيان يطلق على التعريفات الضمنية 
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أنها تعريفات بالاستخدام (عءل رط ١هااةهاءم0)‏ من كون أول استخدام للمتغير الذي ليس له تعريف 


وغالبا ومن أجل السهولة يتم استخدام جدول رموز واحد للاحتفاظ بالأسماء من مختلف أنواع التعريفات 
وخاصة أن جميع لغات البرمجة لا تسمح باستخدام نفس الإسم في أنواع التعريفات المختلفة ولكن في 
بعض الأحوال يفضل استخدام أكثر من جدول للرموز متثل تخصيص جدول منفصل للرموز لكل نوع 
من أنواع التعريفات على حدة. وبعض اللغات تفضل إلحاق جدول رموز منفصل مع المناطق المختلفة 
التي يتضمنها البرنامج على أن يتم ربطها معا وفقا للقواعد الدلالية الخاصة باللغة. 


هذا ويختلف ربط الخصائص بالاسم من خلال التعريف وفقا لنوع التعريفات. فتعريفات الثوابت تلحق 
القيم بالأسماء وتلك القيم هي التي تحدد كيف يعالجها المترجم وبالطبع فإن تخصيص القيمة للثوابت يتم 
مرة واحدة. ويمجزد تحديد قيمتها فاه لا يكن تغييرها بعد ذلك وتعريف الثوابت قد تتضمن أيضا 
تحديد نوع البيانات الخاص بكل ثابت بشكل ظاهر مثلها في ذلك مثل المتغيرات بينما لا يتم ذلك في لغة 
ال اهعءهم الذي يتم فيها تحديد نوع البيانات حسب القيمة التي يتم تخصيصها للثابت. 


وفي تعريفات الأنواع يتم تحديد اسم النوع الجديد الذي يتم تعريفه وقد يتم إنشاء اسم بديل للنوع السابق 
تعريفه وعادة ما تستخدم أسماء الأنواع مع الخوارزمية المتعلقة بتوافق الأنواع( معمرآ 
ce‏ enاuivaع)‏ لإنجاز الاختبارات الخاصة بالأنواع وفقا لقواعد اللغة. 

وبالنسبة لتعريفات المتغيرات فإنها غالبا ما يتم فيها ربط الأسماء بأنواع البيانات وقد يتم أيضا تحديد 
بعض الخصائص بشكل ضمني مثل المدى ( ممه٥ء5)‏ الذي يحدد منطقة البرنامج ولكنه قد يتأثر 
بالتفاعلات مع التعريفات الأخرى ويجب التأكد أن المدى قد يكون أيضا أحد خصائص الثوابت والأنواع 
والإجراءات وليس فقط المتغيرات. لهذا سيتم مناقشته بالتفصيل في جزء مستقل. 

وأحد الخصائص الأخرى المرتبطة بمدى المتغير الذي يتم تعريفه هي موقع الذاكرة المخصص لذلك 
المتغير وفترة صلاحية هذا التخصص ففي لغة السي على سبيل المثال فإن جميع المتغيرات التي يتم 
تعريفها خارج الوظائف يكون التخصيص لموقع الذاكرة الخاص بهذه المتغيرات ثابت ( عاخه†5) 
وبالتالي فإن فترة صلاحيته يكون خلال فترة تشغيل هذه الوظيفة فقط مع العلم بأن لغة السي تسمح 
بتوسيع مدى التعريف الذي يتم داخل أي وظيفة وجعله ثابتا وذلك بإضافة كلمة ءاه إلى التعريف كما 
في الوظيفة التالية: 


(int count (void 


} 


;static int count = O 


;return ++count 
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وعموما فإننا لن نهتم بدراسة أساليب تخصيص مواقع الذاكرة في هذه المادة العلمية وبدلا من هذا سنعود 
لتحليل المدى والأساليب المتعلقة بمعالجة المدى في جدول الرموز وذلك في الجزء التالي. 
. قواعد المدى 


E SA ARES SS A NAL TOE CA E AS 
القواعد الشائعة فى العديد من اللغات وسنركز فى هذا الجزء على قاعدتين فقط من القواعد الشائعة‎ 
للمدى الأولى مرتبطة بالتعريف قبل الاستخدام بينما تتعلق القاعدة الثانية بالتفرع الأقرب في الأوامر‎ 
المركبة. قاعدة التعريف قبل الاستخدام (عءل 80۲۵ ۸٥ااةإهاءم0) هي قاعدة شائعة ومستخدمة في‎ 
لغة السي و ال اهعوهم و التي تتطلب أن يتم تعريف الاسم داخل البرنامج قبل أي استخدام لهذا الإسم‎ 
وه الفا عدي قط با جقرل الرمون أقاء مرح تفال الف اتخون بحت تح عة الح عن‎ 
الاسم داخل جدول الرموز مع كل استخدام له وإذا فشلت عملية البحث في إيجاد الإسم فهذا يعني حدوث‎ 
مخالفة للقاعدة التي نحن بصددها. وعند ذلك يقوم المترجم بإظهار رسالة خطأ مناسبة وهذه القاعدة تدعم‎ 
عملية الترجمة من مرحلة واحدة وهناك بعض لغات البرمجة لا تشترط القيام بالتعريف قبل الاستخدام.‎ 
وتلك اللغات تحتاج لمرحلة منفصلة لبناء جدول الرموز وبالتالي لايمكن إجراء الترجمة من مرحلة‎ 
)عها8) الشائعة الاستخدام في لغات البرمجة‎ Su c†u واحدة. أما فيما يتعلق بالهياكل الكتلية ( م‎ 
الحديثة والتي تقوم على استخدام تراكيب برمجية تحتوي على تعريفات تسمى كتلة ()عها8) وهو ما‎ 
ينطبق في لغة البرمجة إهعءوجوم على البرنامج الرئيسي ( a۳٬عه٣۴ "اج۷ ) . وعلى التعريفات‎ 
(Compilation Units ) الخاصة بالإجراءات والوظائف وفي لغة السي تشمل وحدات الترجمة‎ 
بينما في لغات البرمجة‎ ٠» وتعريفات الوظائف والأوامر المركبة التي يتم وضعها بين الأقواس إ)‎ 
فتنطبق علی تعریفات‎ ) ObزectR‎ Oriented Programming Language ) الموجه للأغراض‎ 
الفصائل ( كم ههام0 ءءها٣) . وعموما فإنه يطلق على لغة البرمجة أنها لغة مهيكلة كتلية‎ 
إذا سمحت بتفرع کتل داخل کتل أخری علی أن یکون مدی‎ )Bاock)‎ Structured Language) 
التعريفات داخل أي كتلة محصوراً في هذه الكتلة فقط وجميع الكتل الأخرى التي يتضمنها وعند وجود‎ 
أكثر من تعريف مختلف لنفس الإسم فإن التعريف الذي يطبق عند استخدام الإسم هو التعريف الذي يقع‎ 
Most Closely ) فئ قرب كتلة فر عية لهذا الاستخدام وهذه القاعدة هي ما تسمى قاعدة التفرع الأقرب‎ 
ولتوضيح الهياكل المجمعة ومدى تأثير قاعدة التفرع الأقرب على جدول الرموز نقدم‎ )Nestعd‎ Ruام‎ 
جزء برنامج السي التالي:‎ 


inti, j 
(int f (int size 


;char i, temp } 


; double j } 
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; char *j } 


{ 


حيث يلاحظ أنه يحتوي على خمسة كتل الكتلة الأولى يشمل جميع الخطوات ويحتوي على تعريفات 
المتغيرات الصحيحة ز , ¡ و الوظيفة ۴ و الكتلة الثانية هي تعريف الوظيفة ۴ نفسها والتي تحتوي على 
تعريف المتغير 2ء أما الكتلة الثالثة فهو الأمر المركب الخاص بجسم الوظيفة ۴ والتي يحتوي على 
تعريفات المتغيرات الرقمية الحرفية مص" ع , أ¡ ( ويمكن اعتبار الكتلتين الثانية والثالثة ككتلة واحدة ) 
بينما الكتلة الرابعة فهي الأمر المركب الذي يحتوي على تعريف المتغير ز كمتغير حقيقي مزدوج 
وأخيرا الكتلة الخامسة وهو أمر مركب أيضا يحتوي على تعريف المتغير ز كمؤشر حرفي وداخل 
الوظيفة ۴ يوجد تعريفا واحداً لكل من المتغير مء والمتغير م٠‏ في جدول الرموز وبالتالي فإن أي 
استخدام لهذين المتغيرين سيكون وفقا لهذا التعريف الوحيد لهما وبالنسبة للمتغير ¡ فإنه يوجد تعريف 
محلي (١٥اة۲هاءم‏ اهعه]ا) له كمتغير حرفي داخل جسم الوظيفة هذا بالإضافة إلى تعريف آخر له 
غير محلي كمتغير صحيح ولكن وفقا لقاعدة التفرع الأقرب فإن التعريف المحلي هو الذي يؤخذ به في 
هذه الكالة وينقس الظريقة بانتية للمتغيز ر الذي يوج له اة تعريفات أخدها هير مخلي قل الرظنة 
۴ وتعريفان محليان داخل كل من الكتلة الرابعة والخامسة. ووفقا لنفس القاعدة فإن التعريف المحلي 
الخاص بكل مجمع منهما هو الذي سيطبق داخلهما ولن يعاد تطبيق التعريف غير المحلي إلا بعد 
الخروج من الوظيفة f‏ 


وفي بعض اللغات متل أل اعوج و أل هك يتم السماح بالتفرع في الإجراءات والوظائف أي يمكن 
أن يكون هناك إجراء أو وظيفة داخل إجراء أو وظيفة أخرى وهذا يزيد من التعقيد في بيئة تشغيل 
البرنامج المكتوب بأحدى هاتين اللغتين. وعموما فإنه يجب عند تنفيذ عملية الإضافة إلى جدول الرموز 
عدم فقد التعريفات السابقة للأسماء ولكن يتم فقط إخفاءها بحيث لا يظهر أثناء عملية البحث عن اسم 
محدد إلا التعريف الأحدث فقط لهذا الاسم. وكذلك بالنسبة لعملية الحذف حيث لا يجب حذف جميع 
التعريفات الخاصة باسم محدد ولكن أحدثها فقط ليتم الكشف عن أحد التعريفات السابقة لهذا الإسم بمعنى 
الحذف المقابلة لنفس الأسماء عند الخروج من الكتلة وذلك ما يعني أن جدول الرموز يعمل مثل المكدس 


وهناك أيضا عدد من الطرق الأخرى البديلة التي يمكن استخدامها للتعامل مع تفرعات المدى وإحدى 
هذه الطرق هو بناء جدول رموز جديد لكل مدى على أن يتم ربطها معا من المدى الداخلي إلى المدى 
الخارجي بالترتيب بحيث تستطيع عملية البحث أن تستمر أوتوماتيكيا في البحث داخل الجدول التالي 
عند الفشل في إيجاد الإسم في الجدول الحالي. وفي هذه الطريقة فإن الخروج من مدى معين يحتاج إلى 
جهد أقل لأنه بدلا من حذف جميع التعريفات التي تمت داخل هذا المدى باستخدام عملية الحذف فإنه 
يمكن حذف الجدول بالكامل بجميع محتوياته في خطوة واحدة. 
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3. تفاعل تعريفات نفس المستوى 


أحد المواضيع المرتبطة بالمدى هو التفاعل ( ٣هi†ءه٣عم|)‏ بين التعريفات التي تتم في نفس 
المستوى من التفرع أي في كتلة واحدة وهذا التفاعل يختلف وفقا لنوع التعريف وأيضا حسب اللغة 
المطلوب ترجمتها ولكن هناك مطلب معتاد في أغلب لغات البرمجة وهو عدم استخدام نفس الإسم في 
أكثر من تعريف داخل نفس مستوى التفرع فمتلا إذا تمت التعريفات التالية في لغة ° فإنها تحدث خطأً 
في الترجمة : 


;typedef int i 
;int i 


ولاختبار هذا المطلب فإن المترجم لا بد أن يقوم بعملية البحث داخل جدول الرموز قبل كل عملية 
إضافة على أن يحدد بأسلوب معين إذا كان هناك تعريفا سابقا بنفس الاسم في نفس مستوى التفرع أم لا 
ولكن السؤال الأكثر صعوبة في هذا الخصوص ما هو حجم المعلومات المتاحة لكل تعريف عن 
التعريفات الأخرى الموجودة معه في نفس المستوى من التفرع؟ فمثلا بفرض جزء البرنامج التالي 
المكتوب بلغة ° : 


;inti=1 
(void f (void 


inti=2,j=i+1} 


والسؤال الان ما هي القيمة المبدئية التي ستخزن في المتغير ز الذي داخل الوظيفة ۴ وهل هي 2 أم 3 
وهذا يتوقف على أيهما سيستخدم التعريف المحلي للمتغير ¡ أم التعريف غير المحلي لهذا المتغير وقد 
يكون من الطبيعي أن يتم استخدام التعريف المحلي على اعتبار أنه التعريف الأحدث وكذلك تطبيقا 
لقاعدة التفرع الأقرب التي شرحناها في الجزء السابق. وفي الحقيقة هذا ما يتم في لغة السي وهذا 
بافتراض ان كل تعريف يتم إضافته على حدة على جدول الرموز أثناء تنفيذ أمر التعريف المتعدد وهذه 
الطريقة في تنفيذ التعريفات تسمى طريقة التعريفات المتتابعة (ء 0ة هام٥‏ اهentiمSequ)‏ لأنه من 
الممكن بدلا من ذلك أن يتم إضافة جميع التعريفات بشكل متزامن ومرة واحدة إلى جدول الرموز في 
نهاية تنفيذ الجزء الخاص بالتعريفات وهذه الطريقة تسمى طريقة التعريفات المتوازية ( اجاعاةااه٣‏ 
ئ5اratهاec()‏ وفي هذه الحالة فإن استخدام أي اسم داخل تعبيرات خلال الجزء الخاص بالتعريفات 
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سيكون وفقا للتعريف السابق له وليس التعريف الجديد وهناك بعض لغات البرمجة تتبع تلك الطريقة في 
التعريفات والتي يتطلب إتباعها عدم إضافة التعريف مباشرة على جدول الرموز الحالى ولكن تجميعها 
فى جدول مؤقت تم اضافتها بعد ذلك إلى جدول الرموز عند الانتهاء من جميع التعريفات. 

وهناك أيضا حالة التعريفات التكرارية (sهااة٣ةاءم0‏ ع۷أوuءمR)‏ والتي يشير فيها التعريف السابق 
إلى نفسه والتي تحدث عند تعريف الإجراءات أو الوظائف التكرارية (ءہ اہ ں۴ عivأRecus)‏ حيث 
تستدعي الوظيفة نفسها كما في الوظيفة التالية المكتوبة بلغة السي والتي تقوم بحساب القاسم المشترك 
الأعظم (or‌یDivi Common‏ eatest‌اG)‏ لعددین صحیحین: 


(int gcd (int n, int m 
;if (m==0) return n } 


;(else return gcd(m, n % m 


{ 


الرموز قبل دخول جسم الوظيفة وإلا فإنه لن يجد هذا الاسم في الجدول عند الوصول إلى الجزء 
التكراري الذي تستدعي فيه الوظيفة نفسها والحالة الأكثر تعقيدا هي حالة وجود مجموعة من الوظائف 
يتم بينها التكرار بشكل غير مباشر كما في الجزء التالي من البرنامج بلغة السي: 


(void f (void 

{8 } 

(void g (void 

{f} 

فی ا ا ان كن كاه اة ا اة هن الكل فى جا ب كر ادرت الاق 
سوف يحدث خطأ في الترجمة عند استدعاء الوظيفة ع داخل الوظيفة ۴ لان الوظيفة ع لن يكون قد تم 
إضافتها بعد إلى جدول الرموز عند استدعائها داخل الوظيفة ۴ و قد تم حل هذه المشكلة في لغة السي 
من خلال تعريف ما يسمى نموذج الوظيفة ( ممر†هاه٣۴‏ هاعم )۴u‏ وفي الحالة السابقة يتم تعريف 
نموذج للوظيفة ع قبل الوظيفة ۴ كما يلي: 

/”* void g(void); /* function prototype 


(void f(void 
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{ O8 } 


(void g(void 


Of }‏ { 
ونتيجة لتعريف نموذج للوظيفة ج » فقد تم توسيع المدى الخاص لهذا الإسم لتشمل الوظيفة ۴ وذلك لأن 
المترجم سيقوم بإضافة اسم الوظيفة إلى جدول الرموز عند تعريف النموذج الخاص بها وقبل البدء في 
تعريف الوظيفة نفسها وبالطبع لا بد أن يحدث تطابق بين نموذج الوظيفة وتعريفها في عدد ونوع 

التغطات الف تكاحه 
. مثال شامل للقواعد الخصائصية باستخدام جدول الرموز 

نريد الآن تقديم مثال يعرض عددا من صفات التعريفات التي تم وصفها مع تطوير القواعد 
الخصائصية التي تجعل هذه الصفات واضحة في أداء جدول الرموز. والقواعد النحوية التي ستستخدم 
في هذا الماك ٠‏ هى الق اع النخر نة الخامعة اترات اارياشوهة المطة ب (تنافة الهز ‏ الخاكن 
بالتعريفات إليها لتصبح كالتالي: 


S 2 exp 
exp 3 (exp ) | exp + exp | id | num 
let decBlist in exp | 
dec@list > decBlist , dec | dec 
dec 2 id = exp 
وهذه القواعد النحوية تتضمن الرمز اللانهائي 5 كرمز للبداية ولأن القواعد الخصائصية تحتوي‎ 


على خصائص موروثة ستحتاج إلى تحديد قيمتها في البداية عند جذر شجرة النحو. لذلك سنكتفي بعملية 
حسابية واحدة فقط هي عملية الجمع من أجل التبسيط. ويلاحظ أن هناك غموضا في تلك القواعد النحوية 


ولكن نفترض أن وحدة الإعراب قد قامت بالفعل بحل هذا الخموض وتم إنشاء شجرة النحو. 

ومثل الأمثلة السابقة باستخدام قواعد نحوية مشابهة فإننا في هذا المثال نفترض أن كلا من صم , كا 
هما مفردتان تم تحديد تركيباتهما أثناء مرحلة تحليل المفردات حيث يمكن افتراض أن المفردة ںہ 
هي سلسلة من الأرقام والمفردة ل¡ هي سلسلة من الحروف. 


وقد تم إضافة الجزء الخاص بالتعريفات إلى القواعد النحوية والذي يمثلة القاعدة النحوية الآتية: 


exp > let dec-list in exp 
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حيث تشمل تعريفات متتابعة من التعريفات يفصل بينهما الفاصلة ',' وكل تعريف يكون على الشكل ١أ‏ 
م×ه = كما المثال التالي : 


letx=2+1,y=3+4inx+Yy 


ودلالة التعبير |٠٤‏ في القاعدة النحوية أن التعريفات التي تلي المفردة |٠‏ تعطي أسماء للتعبيرات بحيث 
يتم عند ظهور تلك الأسماء في التعبير الذي يلي المفردة م¡ للاستعاضة عن هذه الأسماء بقيمة التعبيرات 
التي تمتلها الأسماء. وبالطبع فإن قيمة التعبير |٠٤‏ هو القيمة النهائية للتعبير الذي بلي المفردة م¡ والذي 
يتم حسابه بعد استبدال كل اسم في التعريفات بقيمة التعبير الذي يمثله هذا الاسم وعند تطبيق ذلك على 
المثال السابق فإن الاسم × يمثل القيمة 3 بينما الإسم ل يمثل القيمة 7 وبالتالي فإن قيمة التعبير |٠٤‏ هي 
0 . 


ومن الدلالة التي تم استخلاصها للتعبير |٠٤‏ نجد أن التعريفات التي يحتوي عليها تشبه تعريفات الثوابت 
وأن تعبير | نفسه يمتل الكتلة الخاصة بهذه اللغة وبالتالي فنحن نحتاج إلى وصف قواعد المدى 
والتفاعل بين التعريفات في تلك التعبيرات حيث يلاحظ أن القواعد النحوية السابقة تسمح بالتفرغ في 
تعبيرات |٠‏ إلى أي مستوى مثل التعبير التالي : 
letx=2,y=3 in‏ 
(letx=x+1,y=(letz=3inx+¥+Z )‏ 
(in (x+y‏ 
( 

والآن نقوم بوضع قواعد المدى الخاص بتلك التعبيرات حتى يمكن تحديد قيمة التعبير السابق ولنبداً 
بعدم السماح بإعادة تعريف نفس الاسم خلال نفس التعبير بمعنى إن التعبير الاتي: 
letx=2,x=3inx+1‏ 
يعتبر غير سليم ويعطي خطأ. 

أما القاعدة الثانية فهي إذا كان أي اسم غير معرف في المستوى الذي يوجد به التعبير أو في 


المستويات الأعلى منه يتم إظهار خطأ مثل التعبير التالي: 
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letx=2inx+y 


والقاعدة الثالثة هي أن المدى لكل تعريف في التعبير |٠‏ يمتد إلى جسم التعبير وفقا لمبداً التفرع الأقرب 
في هيكل الكتلة د بمعنى أن قيمة الد لتعین الاي 


(letx =2 in (let x = 3 in x 


لأنه التعريف الأقرب له. 


وفي النهاية نقوم بتحديد التفاعل بين التعريفات في قائمة التعريفات بنفس التعبير على أنها متتابعة 
(اaأ٣مuوeهS)‏ بمعنى أن كل تعريف يمكن أن يستخدم التعريفات السابقة في حل الأسماء الذي يحتوي 
عليها اأ لتعبير الذي يمثله فمثلا في الد لتعبير التالي : 


(letx=2,y=x+1in (letx=x+y,y=x+yiny 


فإن ل الأولى تكون قيمتها 3 و × الثانية تكون قيمتها 5 أما ب الثانية فإن قيمتها 8 وبالتالي فإن القيمة 
النهائية للتعبير |٠٤‏ السابق هي 8 والآن وبعد الانتهاء من وضع القواعد المتعلقة بالمدى والتفاعل بين 
ارفاك د عو قاري لى حفاة فة ال 8ا عاشي و وات ا ا وای که 
تقديمة في الصفحة السابقة. 


ونحن نريد الآن إعداد معادلات القواعد الدلالية التي سترتبط بالقواعد النحوية السابقة على أن يتم 
استخدام جدول الرموز في متابعة تعريفات التعبيرات |٠‏ وذلك وفقا لقواعد المدى والتفاعل التي تم 
الها من رقمل و لط مك اكام درل لزور فط فى التخدد ما اذا كن اكير سلب أ 
يتضمن أخطاء. وسوف نقوم بحساب الخاصية المصنعة ٠٣۲‏ والتي تكون قيمتها م٣‏ إذا كان التعبير 
يحتوي على أخطاء و عء|ه] إذا كان التعبير سليما وفقا للقواعد. وللقيام بذلك نحتاج إلى كل من الخاصية 
الموروثة امم ا†ومم التي تحدد ما إذا كان التعريفان في نفس كتلة |٤‏ وهذه الخاصية تكون قيمتها رقم 
صحيح غير سالب يعبر عن مستوى التفرع الحالي للكتلة |٠‏ وتأخذ القيمة 0 قبل البدء في أي تفرع. 


والخاصية طa†"رك‏ سوف تحتاج إلى جميع العمليات الخاصة بجدول الرموز ولأن تلك العمليات 
سيتم استخدامها من خلال القواعد الدلالية لذلك سوف يتم التعبير عنها بشكل مبسط. فعملية الإضافة 
سوف تأخذ جدول الرموز كمعطيات على أن ترجع جدول الرموز بعد إضافة المعلومات الجديدة مع 
الإحتفاظ بالجدول الأصلي بدون تغيير. فالعملية ا(| ," ,ء)ا 6ء"¡ سوف تعود بجدول رموز جديد 
يحتوي على جميع المعلومات التي في الجدول ء مع إضافة الإسم م" مع مستوي التفرع | مع عدم تغيير 
الجدول ء . وبالتالي فليس هناك ضرورة لوجود عملية منفصلة للحذف من جدول الرموز ولاختبار 
وجود الإسم في جدول الرموز. وكذلك استرجاع مستوى التفرع المصاحب له إذا كان موجوداً في 
الجدول» فإن هناك عمليتان للقيام بذلك الأولى هي ا( , ء) ٠وا‏ التي تقوم بإرجاع عمںم) إذا كان الإسم م 
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موجودا في الجدول ء و هءاه؟ إذا كان غير موجود في جدول الرموز ء أو ترجع -1 إذا كان غير 
موچود, 


ومع هذه العمليات الخاصة بجدول الرموز نستطيع الآن كتابة معادلات القواعد الدلالية للخصائص 
الثلاثة ا ة†مرء و ام۷عا†وعم و ٣٣م‏ الخاصة بالتعبيرات لتصبح القواعد الخصائصية كما يلي: 


حيث يلاحظ استخدام جدولين مختلفين للرموز مع كل من اءا-ءعل و اعم الأول هو طهم: الذي 
يمثل جدول الرموز قبل التعريفات والثاني طهاںه الذي يمثل نفس الجدول السابق ولكن بعد إضافة 
التعريفات كما يلاحظ أيضا ظهور حالة خاصة لجدول الرموز هي طه۲۲٠‏ والتي تحدث عند وجود 
خطأ فى التعريف نتيجة لمخالفة قواعد المدى. 
. تحليل الدلالات للغة الافتراضية 


إن اللغة الإفترضية التي تم تقديمها في الوحدة الأولى وتم وصف القواعد النحوية الخاصة بها في 
الوحدة الرابعة بسيطة في احتياجاتها الخاصة بالدلالات الثابتة وسوف تعكس وحدة تحليل الدلالات تلك 
البساطة فلا يوجد آي تعریفات واضحة في هذه اللغة ولا يوجد تسمية للثوابت أو أنواع البيانات كما لا 
يوجد إجراءات والأسماء تستخدم فقط مع المتغيرات التي يتم تعريفها ضمنيا من خلال الاستخدام حيث 
يتم معاملة جميع المتغيرات على أنها متغيرات صحيحة ( ءعاطهاة۷ ۲مععtم!ا)‏ ولا يوجد تفرع في 
دی ادل کن ات لرک ای کال ا دال ران کن اا 
يحتاج لأن يتعامل مع أي معلومات بخصوص المدى. 


هذا سوف نقسم مناقشتنا بخصوص تحليل دلالات تلك اللغة الافتراضية إلى جزأين الأول لمناقشة هيكل 
جدول الرموز والعمليات المرتبطة به والثاني لوصف عمليات محلل الدلالات نفسه شاملا بناء جدول 
الرموز. 


4. جدول رموز اللغة الافتراضية 


لتصميم جدول الرموز الخاص بتحليل دلالات اللغة الافتراضية يجب أولا تحديد المعلومات التي 
نحتاج الاحتفاظ بها في هذا الجدول. وبصفة أساسية فإن هذه المعلومات تشمل نوع البيانات ومعلومات 
المدى. وحيث أن اللغة الافتراضية ليس لديها معلومات عن المدى كما أن جميع المتغيرات من نوع 
البيانات الصحيحة لذلك فإن جدول الرموز لا يحتاج أن يحتوي على مثل هذه المعلومات. ولكن أثناء 
مرحلة توليد شفرة البرنامج المستهدف من الترجمة فإن تلك المتغيرات التي يحتوي عليها البرنامج 
المطلوب ترجمته تحتاج إلى تخصيص موقع لها في الذاكرة ولأنه لا يوجد تعريف لهذه المتغيرات فإن 
جدول الرموز يكون هو المكان المنطقي للاحتفاظ بهذا الموقع المخصص للمتغيرات في الذاكرة وسوف 
نفترض الآن أن هذا الموقع سیتم تمثیله بعداد صحیح ( ٣٤٤١‏ ںہ ٣ععم†ہا)‏ یتم زیادتھ مع کل متغیر 
جديد ولكي يكون جدول الرموز أكثر فائدة سوف نستخدم الجدول أيضا في توليد قائمة بأرقام السطور 
الذي يظهر فيها كل متغين فى البز نامج اوغلى اسيل المثال» قان السطلومات التي سم تو ليذها جواسطة 
جدول الرموز بافتراض البرنامج التالي المكتوب باللغة الإفتراضية وهو نفس البرنامج السابق تقديمه 
بهذه اللغة من قبل ولكن بعد إضافة أرقام السطور إليه : 
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sample program} :1 
computes factorial :2 
{:3 

,read x :4 

if O < x then :5 

;fact := 1 :6 

repeat :7 

;fact := fact * x :8 
X=xXx-1 :9 

;until x = O0 :10 
write fact :11 

end :12 


وبعد إنشاء جدول الرموز للبرنامج السابق فإنه سيكون كما يلي: 


مع ملاحظة أن ظهور المتغير أكثر من مرة في نفس السطر في البرنامج سيكرر رقم السطر أكثر من 
ر ایر کی جو ن ایر و عو ا فن اکل ااه لرل لر ی ج لخا د 
هيكل الجدول العشوائي ( عماطاةآ ءة!٠)‏ ولأنه لا يوجد معلومات في الجدول عن المدى فليس هناك 
ون لا الف هن الحدزل اسا عة اهاه ك م ج ف الي ر ابطر م ا رة 
ا ا وو شا ا ات ا رن او ر ل 


4.., محلل دلالات اللغة الافتراضية 


إن الدلالات الثابتة للغة الافتراضية تشترك مع لغات البرمجة التقليدية في كون جدول الرموز أحد 
الخصائص الموروثةء بينما نوع البيانات الخاصة بأي تعبير هو خاصية مصنعة. وفي هذا الصدد يجب 
الإشارة إلى أن هذه اللغة يوجد بها أيضا نوع بيانات آخر بخلاف البيانات الصحيحة وهو نوع البيانات 
المنطقية ( ”2ا0 8) ولكن هذا النوع الأخير من البيانات يظهر فقط كنتيجة لمقارنة قيمتين صحيحتين 
لأنه لا يوجد عمليات أو متغيرات من هذا النوع في اللغة. ويظهر التعبير المنطقي في الشرط الخاص 
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Compiler for msc of cs 


بأمر ۴¡ أو أمر اجممهم ولا يمكن أن يظهر| أي قيمة من هذا النوع في أي عملية كما أنه لا يمكن أن 


تمثل مخرجات باستخدام أمر We‏ . 


وعموما فإن جدول الرموز في هذه اللغة الافتراضية يمكن أن يتم بناءه بواسطة التنقل بالترتيب السابق ( 


)Preorder raversal‏ لشجرة النحو. 
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